일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 패스트캠퍼스데이터분석부트캠프
- qgis
- 코딩테스트
- 코딩연습
- bigquery
- 데이터분석가
- 아나콘다
- 국비지원
- 데이터분석부트캠프
- mysql
- shp
- Programmers
- Python
- 패스트캠퍼스기자단
- 내일배움카드
- 패스트캠퍼스
- 부트캠프
- 국비지원교육
- 데이터분석취업
- 국비지원취업
- 코딩테스트문제풀이
- 데이터분석
- 학습일지
- 코테문제풀이
- K디지털기초역량훈련
- 프로그래머스
- sql강의
- 패스트캠퍼스부트캠프
- WSL
- SQL
- Today
- Total
데이터 리터러시를 위한 발자취
[Airflow] 윈도우 환경에서 WSL 및 Airflow 설치하기 본문
안녕하세요! 지난번 공지드린대로 최근 Airflow를 공부 중입니다.
윈도우 환경에서 Airflow 설치까지는 완료했는데, 좀 더 준비해서 의미있을만한 산출물로 만들고 싶어서요.
이왕 데이터 파이프라인 구축하는 김에 관심있는 도메인 기반 데이터 분석 환경을 구축해볼까 생각 중입니다!
Airflow 개념을 1도 모르고 시작하는거라 생각보다 시간이 걸릴 것 같아서..우선 WSL 및 Airflow 설치방법을 먼저 공유하려고 합니다!
Airflow 설치를 위해 저도 이것저것 검색해봤는데 대부분 Mac OS 기준으로 작성된 게 대부분이더라구요.
Airflow가 윈도우 환경에서 직접 설치가 불가한 점 때문인 것 같았습니다.
물론 윈도우 환경에서 설치하는 방법을 작성해둔 블로그를 여러개 봤지만 상세히 다룬 곳이 없어서 조금 힘들더라구요.
그래서 WSL 설치방법부터 Airflow까지 상세히 다뤄볼까 하니 길어도 양해 부탁드립니다-!
# 윈도우 환경에서 WSL 및 Airflow 설치하기
1. WSL 설치하기(Windows 11)
2. WSL 기반 Airflow 설치하기
3. Ubuntu 내 가상환경 설정하기
1. WSL 설치하기(Windows 11)
※ 유튜브 영상 링크로 내용 일부 대체함을 참고해주세요-! 상세히 설명해주시기 때문에 영상만 봐도 설치할 수 있습니다.
1) WSL이란?
- Windows Subsystem for Linux의 약어로, Windows에서 리눅스 실행환경을 지원하는 Windows의 확장 기능 의미
- Windows에서 리눅스 작업 환경을 만들기 위해 WSL 설치 필수
2) 간단한 리눅스 명령어들
3) WSL 설치하기
- Windows PowerShell 관리자 모드 실행 → wsl --install 실행
- 설치 완료 후, Enter new UNIX username과 New Password 작성 필요
4) WSL 실행하기
- 윈도우 검색창에서 WSL 검색(윈도우 버튼 키 또는 하단 작업표시줄 검색 클릭)
- WSL 실행 시, 기 생성한 WSL UNIX username으로 자동 로그인됨(관리자모드 실행
2. WSL 기반 Airflow 설치하기
※ Airflow 설치 전, WSL 기반 Python 설치 과정도 포함하고 있습니다. 아래 절차대로 진행 부탁드려요 :)
1) Python 및 기타 패키지 설치
(1) 패키지 리스트 업데이트
sudo apt update
(2) Python 설치
sudo apt install python3 python3-pip
(3) Airflow에 필요한 추가 패키지 설치
sudo apt install libmysqlclient-dev
2) Airflow 설치
(1) Airflow 설치를 위한 환경 변수 설정
export AIRFLOW_HOME=~/airflow
(2) Airflow 설치
- 해당 과정까진 WSL에서 코드 실행
pip install apache-airflow
(3) Airflow db 초기화
- Airflow 설치까지 완료되었다면, Ubuntu 활성화 필요(WSL에서 아래 코드 실행 불가)
- Ubuntu 활성화 방법은 1-4) WSL 실행하기와 동일하게 검색하여 실행하면 됨
airflow db init
(4) Airflow 폴더 안에 dags 디렉토리 생성
mkdir dags
3) Airflow 웹 서버 실행
(1) Airflow 웹 서버 시작
- 기본 포트가 8080으로 설정되어 있기 때문에 airlow webserver라고만 작성해도 실행 가능함
airflow webserver -p 8080
(2) 별도의 터미널에서 Airflow 스케줄러 실행
airflow scheduler
(3) Chrome 또는 Window edge에서 Airflow 접속하기
- 아래 주소 복사 후, Chrome에 붙여넣기
http://localhost:8080
(4) Username 및 Password 생성하기
- username 및 password 부문에 자신이 원하는 정보로 변경하여 코드 실행
- 비밀번호의 경우, 로그인 후 추가 변경 가능하니 최초 접속 때는 간단하게 만들어도 무방함
airflow users create --role Admin --username admin --email admin --firstname admin --lastname admin --password admin
*️⃣ 만약, 상단 코드의 의미가 궁금하다면, Ubuntu 활성화 후, 'airflow' 코드 실행
(5) Airlfow 메인 화면
- 계정 로그인 후, 아래와 같은 화면 활성화 되면 Airflow 설치 완료! 👍
4) Airflow 비밀번호 변경하기
(1) 우측 상단 붉은 박스 클릭 - Your Profile 선택
(2) 하단 Reset my password 선택을 통해 비밀번호 변경 가능함
3. Ubuntu 내 가상환경 설정하기
1) Python3-venv 패키지 설치
- 해당 절차의 경우, 설치된 Python 버전에 맞게 설치해야 함
- Python 설치 버전 확인 방법 : python3 --version 실행
sudo apt install python3.10-venv
2) 가상환경 설정하기
- 가상환경명은 편의에 따라 설정 가능
python3 -m venv airflow(가상환경명)
3) 가상환경 활성화/비활성화 방법
- 가상환경 활성화 시, 아래 이미지 처럼 계정명 앞에 '(가상환경명)' 이 활성화됨
source airflow/bin/activate # 활성화
deactivate # 비활성화
이렇게 윈도우 환경에서 WSL 및 Airflow 설치와 더불어 Ubuntu에서 가상환경 설정까지 하는 방법을 보여드렸는데요.
잘 참고하셔서 다들 설치 성공하셨으면 좋겠습니다 :)
그럼 오늘도 긴 글 읽어주셔서 감사합니다~!

'데이터 분석 > Airflow' 카테고리의 다른 글
[Airflow] DBeaver에서 Ubuntu의 MySQL 연결하기 (2) | 2023.12.08 |
---|---|
[Airflow] Naver API 기반 Airflow 파이프라인 구축하기 (0) | 2023.12.05 |