일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 아나콘다
- K디지털기초역량훈련
- 패스트캠퍼스부트캠프
- WSL
- 데이터분석가
- 패스트캠퍼스기자단
- Python
- 부트캠프
- 데이터분석부트캠프
- 국비지원
- 내일배움카드
- 학습일지
- 패스트캠퍼스
- 코딩연습
- 데이터분석
- 데이터분석취업
- mysql
- 국비지원교육
- 국비지원취업
- 패스트캠퍼스데이터분석부트캠프
- 코딩테스트문제풀이
- bigquery
- sql강의
- 프로그래머스
- qgis
- shp
- SQL
- 코딩테스트
- 코테문제풀이
- Programmers
- Today
- Total
데이터 리터러시를 위한 발자취
[부트캠프] 데이터분석 학습일지 1주차 본문
데이터분석 부트캠프 참여 이후 처음으로 작성하는 학습일지 1주차입니다-!
이번주는 크게 3가지 세션의 주제를 중심으로 이뤄졌는데 각 세션별로 주요 내용들 중심으로 정리할 예정입니다.
# 부트캠프 1주차
1. 빅데이터 이해 & 데이터 리터러시 함양
2. 실무 엑셀 데이터 분석
3. 데이터 분석을 위한 기초 수학/통계
1. 빅데이터 이해 & 데이터 리터러시 함양 (Day 2)
첫 실시간 강의로 진행된 수업인만큼 빅데이터 이해와 관련 직무들, 실제 데이터 기반 경영 사례 등 다양한 내용을 전달하는 시간이었습니다.
빅데이터 SI 회사에 다녔었지만 관련 교육은 처음 받아보는 것이나 마찬가지였기에...
Data Driven 관련 각 업계별 현황이 어떠한지 세부적으로 알 수 있어서 유익했던 시간이었습니다.
최근 채용 트렌드나 데이터 기반 활용 분야, 앞으로의 방향 등 알기 쉽게 설명해주셔서 좋았습니다.
무엇보다 다양한 데이터 분석 관련 직무들에 대한 특징과 업무 예시 등 쉽게 풀어주시다보니 하고 싶은 직무를 고민하는 데 있어 많은 도움이 될 것 같아요.
개인적으론 프로덕트 분석가(Product Analyst)나 비즈니스 분석가(Bisiness Analyst) 쪽에 관심이 많은데, 회사별로 채용 공고에서 요구하는 내용들도 상이한 편이라 이 부분은 열심히 공고를 분석해보면서 결정지어야 할 것 같습니다-!
마침 강사님도 시각화에 관심 많으셔서 Tool별 알려주신 라이브러리를 나중에 써볼 수 있으면 좋을 것 같아요.
다른건 다 들어봤는데 plotly 라이브러리에 있는 dash는 처음 들어봐서 검색해보니 시각적으로 아주 좋아보이네요..ㅋㅋ
# 데이터 시각화 추천 라이브러리
- Python : plotly(dash), matplolib, seaborn
- R : ggplot
- Tableau - storyboard/dashboard
* Plotly(dash) 참고사이트
2. 실무 엑셀 데이터 분석 (Day 3~4)
제가 참여 중인 데이터분석 부트캠프는 엑셀, Python, SQL, Tableau 순으로 진행될 예정입니다.
부트캠프 3일차부터 본격적으로 '엑셀 데이터분석' 과정이 시작되었습니다.
[ Day 3 ]
업무 효율을 높여주기 위한 엑셀 환경셋팅(빠른실행도구모음)과 간단한 실습을 통해 기초를 익히는 수업이었습니다.
회사에서도 종종 쓰긴 했었지만 보고서 보다 데이터 형태 파악으로 활용했던 게 전부여서 몰랐던 기능도 많이 알게되어 측면에서 좋았습니다.
단축키 기반으로 기초 실습할 때 저도 모르게 오..하며 감탄했습니다 ㅎㅎ
특히 빠른실행도구 모음은 써봤었지만 강의해주신대로 셋팅하고 나니 확실히 업무 효율이 올라갈 것만 같았습니다.
실무에서 은근 시간을 잡아먹는 요소들을 콕 집어 알려주셔서 개인적으로는 만족할만한 꿀팁이었습니다.
# 유용한 엑셀 단축키 모음(윈도우 기준)
단축키 | 구분 | 단축키 | 구분 |
ctrl+alt+v | 선택하여 붙여넣기 | ctrl+shift+(+ & -) | 행/열 추가 & 삭제 |
ctrl+방향키 | 방향키대로 커서 이동 | ctrl+9 | 행 숨기기 |
ctrl+shift+방향키 | 범위 및 커서이동 | ctrl+shift+9 | 행 숨기기 취소 |
shift+스페이스 | 행 선택(전체) | ctrl+0 | 열 숨기기 |
ctrl+스페이스 | 열 선택(전체) | ctrl+shift+~ | 최초 상태로 돌아가기 (ctrl+shift+1~5 이후 변환 시 사용) |
[ Day 4 ]
4일차는 엑셀 온라인강의 중심으로 진행되었는데, 3일차에 진행되었던 내용을 예습하는 느낌으로 수강하였습니다.
# IF 함수 : 조건에 만족하는 값과, 만족하지 않는 값을 다르게 표시(부등호/등호 활용)
# 기본 표현식
IF(조건(가정), [조건을 만족할 경우 표시할 값], [조건을 만족하지 않을 경우 표시할 값]
= IF(A1>=90,"합격","불합격")
# 3개 이상 데이터 분류 시, IF 함수를 중첩하여 사용 가능
> IF(C1>=90, "합격", IF(C1>=50, "불합격", "미달")
# VLOOKUP 함수 : 공통 기준 열을 기준으로 n번째 있는 데이터를 찾아오는 함수
※ 함수 적용 조건
1) 공통 기준 열이 있어야 함
2) 공통 기준 열 오른쪽에 있어야 함
3) 공통 기준 내 중복 데이터 없어야 함
# 기본 표현식
VLOOKUP(찾을 기준 데이터, 공통기준열부터 원래 데이터 범위, 불러올 데이터 열 번호, 0)
* 0(FALSE) = 정확히 일치할 때만, 1(TRUE) = 근사치여도 불러옴
= VLOOKUP(C5,LIST!$D$4:$J$24,3,FALSE)
# MATCH 함수 : 찾고 싶은 값이 행/열에서 몇번째에 있는지 숫자로 알려줌
# 기본 표현식
MATCH(내가 찾고 싶은 값, 내자 찾고 싶은 값이 포함된 단일 열/행 범위, [정확히 일치하는 값 or 근사치 여부])
* 0(FALSE) = 정확히 일치할 때만, 1(TRUE) = 근사치여도 불러옴
* VLOOKUP(C5,LIST!$D$4:$J$24,3,FALSE)
▽ 상기 예시 기반, 불러올 열 번호를 MATCH함수 이용 시 아래와 같이 사용 가능
= VLOOKUP($C5,LIST!$D$4:$J$24,MATCH($F$4,LIST!$D$4:$J$4,FALSE),FALSE)
# FIND 함수 : 긴 텍스에서 특정 단어나 문장이 시작하는 위치를 숫자로 출력(띄어쓰기 포함 및 대소문자 구분)
# 기본 표현식
FIND(찾을 텍스트, 텍스트 범위, 문자열을 찾기 시작할 위치)
* 문자열 찾기 시작할 위치는 생략해도 무방함
** 숫자가 나오면 특정 단어 포함된 것, 오류(#VALUE!)가 나면 포함되어 있지 않은 것으로 해석
# SEARCH 함수 : 기본적인 기능은 FIND 함수와 동일하나, 대소문자를 구분하지 않음
# MID 함수 : 텍스트 중간 시작 위치부터 원하는 문자열까지 추출
# 기본 표현식
MID(전체텍스트, 불러올 문자열의 시작위치, 불러올 문자열 수)
=MID(B5,5,3)
# 상관분석 개념 이해하기
1) 상관분석 : 두 변수 간에 선형적/비선형적 관게를 갖고 있는지 분석하는 방법
2) 상관계수 : 두 변수 사이의 상관성을 나타내며, 일반적으로 피어슨(Pearson) 상관계수 사용(-1~1 사이의 값을 나타냄)
* 일반적으로 상관계수 0.7 이상이면 강한 상관관계, 0.7이하이면 강한 음의 상관관계라고 함
** 엑셀 사용 시, 데이터 - 데이터 분석 - 분석도구(상관분석) 선택하여 통계 분석 가능함
# 회귀분석 개념 이해하기
1) 개념 : 두 개 이상 연속형 변수(수치)인 종속변수와 독립변수 간의 관계를 파악하는 분석
2) 사용목적 : 두 변수 간의 관계 파악 및 미래 값 예측
3) 종류 : 독립변수(x) 개수에 따라 단순 회귀분석, 다중 회귀분석으로 구분
4) 평가와 해석 : 결정계수, F값, Y절편 및 X1 계수 확인
- 결정계수 : 0~1의 값을 가지며, 1에 가까울수록 회귀모형이 실제 값을 잘 설명함
- F 값이 0.05 미만이면 유의미하다고 판단
- y=ax+b 에서 Y절편은 b값을 X1 값은 a(기울기)를 뜻함
# 단순회귀분석 개념 이해하기
- 독립변수(x)가 변할 떄 종속변수(y) 값이 어떻게 변하는지를 잘 셜명해주는 직선을 찾아 분석하는 방법
- 평가방법 : 최소제곱법(LSE, Least Square Estimation) | 전체적으로 오차가 작은 직선을 찾음
** 엑셀 사용 시, 데이터 - 데이터 분석 - 분석도구(회귀분석) 선택하여 통계 분석 가능함
3. 데이터 분석을 위한 기초 수학/통계(Day 5)
ADsP 준비할때 공부한 적은 있지만 한때 수포자로써 기초수학/통계는 늘 어려움이 느껴지는 단어인 것 같습니다..ㅎㅎ
그래도 데이터 분석가를 꿈꾸는 만큼 기초수학/통계도 모르고 분석가가 된다는 건 안될 말이겠죠
강사님도 그걸 아시는지(?) 첫 강의 소제목부터 '비전공자도 통계를 공부해야하는 이유' 였습니다..ㅋㅋ
확실히 데이터가 일상화되기 시작하며 모든 직군에 데이터 분석이 자연스레 녹아들어있는 것 같습니다.
이에 따른 실무적 요구 능력 또한 맞는 말이어서 고개를 무한 끄덕일 수 밖에 없었습니다.
1) 데이터를 기반으로 수많은 의사결정 수행하는 것은 더이상 데이터 직군 종사자만의 일이 아님
2) 비즈니스의 근거가 되는 데이터 수치!
[ 실무자 요구 역량 ]
통계 수치를 해석
올바른 인과관계 분석
인사이트를 도출하는 일
시간이 흐를수록 정리해야할 내용이 많아지지 않을까 싶은데 정리하면서 자유롭게 양식 변경해서 업로드할 것 같습니다.
부트캠프 참여 전에 ADsP와 SQLD를 공부했었는데 온라인 강의 들을때 제법 도움 되네요.
온라인 강의는 약간 심리적으론 널널하지만 결코 만만하지 않은 코스인 것 같습니다.
학습일지도 병행해서 수강하니까 별로 쉬지 않고 들었음에도 은근 시간이 부족하네요..
정리하면서 기억에 남는 내용이라면.. 데이터 전처리는 가장 많은 시간과 비용이 필요한 과정(60~80%)이다- 입니다.
"Garbage in, garbage out"
실무를 해봤던 사람으로써 정말..백번 천번 맞는 말입니다..ㅎ

그래도 부트캠프 첫주는 별탈 없이 잘 넘어갔습니다-! 다음주도 힘내서 들어야겠어요..!
'부트캠프 > [패스트캠퍼스] 데이터분석 9기' 카테고리의 다른 글
[부트캠프] 데이터분석 학습일지 4주차 (0) | 2023.07.14 |
---|---|
[부트캠프] 데이터분석 학습일지 3주차 (0) | 2023.07.07 |
패스트캠퍼스 데이터분석 부트캠프 9기 OT 후기 (0) | 2023.07.05 |
[부트캠프] 데이터분석 학습일지 2주차 (0) | 2023.06.30 |
[패스트캠퍼스] 데이터분석 부트캠프 9기 합격 소식 (0) | 2023.06.20 |