-
[Upstage AI Lab 3기] 인공지능으로 풀려는 문제를 찾아내는 과정인 데이터 분석 EDA인공지능 AI/패스트캠퍼스 부트캠프 Upstage AI Lab 3기 2024. 5. 1. 23:42
목차
약 1주일에 걸쳐서, 통계학과 EDA를 배웠다.
내가 정의한 데이터 분석(EDA)은 "인공지능으로 풀려는 문제를 찾아내는 과정"이라고 정의하겠다.데이터 분석 과정
- 해결하려는 문제 찾기
- 데이터 수집: 문제 관련 데이터를 어디서 어떻게 수집할 것인가? API, 크롤링 활용
- 데이터 전처리: 수집한 데이터를 정제 작업이 필요하다.
- 탐색적 데이터 분석: 데이터 상관 관계, 이상치, 결측치
- 가설 수립: 귀납 추론, 대립 추론
- 통계적 분석: 가설 검정, 상관 분석, 회귀 분석
- 모델링 및 예측: 머신러닝 알고리즘 등을 활용하여 패턴 학습 및 예측
- 시각화 및 결과 해석: 여러 데이터를 직관적으로 파악할 수 있도록 그래프화
- 결과를 활용하여 실제 문제 해결
데이터 분석을 위해 가장 많이 사용되는 라이브러리
- numpy
- pandas
분석한 데이터를 그래프로 표현하는 유명한 라이브러리
- matplotlib
- seaborn
- plotly
각종 결과를 웹페이지 대시보드 형태로 만드는 솔루션
- streamlit
- plotly dash
- tableau
numpy에서 중요했던 부분
랜덤 수를 출력할 때, seed()를 사용하면, 다른 사람과 수치를 동일하게 할 수 있다.
seaborn에서 중요했던 부분
데이터 간에 서로에게 영향을 주는 어떠한 상관 관계를 한번에 파악할 수 있도록, pairplot을 그리는 방법이다.
슬래시(/) 또는 역슬래시(\) 형태를 띄는 모양이 있다면, 상관이 있다고 할 수 있다.#패스트캠퍼스 #패스트캠퍼스AI부트캠프 #업스테이지패스트캠퍼스 #UpstageAILab #국비지원 #패스트캠퍼스업스테이지에이아이랩 #패스트캠퍼스업스테이지부트캠프
'인공지능 AI > 패스트캠퍼스 부트캠프 Upstage AI Lab 3기' 카테고리의 다른 글
[Upstage AI Lab 3기] 머신러닝 학습 내용 (0) 2024.06.02 [Upstage AI Lab 3기] 코딩 테스트 준비 (0) 2024.05.20 [Upstage AI Lab 3기] Data Scientist 마인드셋 특강 (0) 2024.04.27 [Upstage AI Lab 3기] 데이터 분석의 근본 Statistics (0) 2024.04.26 [Upstage AI Lab 3기] 소스코드 형상관리 GIT (0) 2024.04.26