개발공부/SK Networks Family AI bootcamp 강의노트

16-17일차 [ 타이타닉 데이터 재분석 ]

HyunJung_Jo 2025. 2. 6. 17:07

자료

수업자료

https://github.com/good593/class_ML/blob/main/2.%20Data%20Preprocessing/1.%20Feature%20Extraction.ipynb

 

class_ML/2. Data Preprocessing/1. Feature Extraction.ipynb at main · good593/class_ML

Contribute to good593/class_ML development by creating an account on GitHub.

github.com

내가 다시 정리한 것

https://colab.research.google.com/drive/11ZlDI4oc33CugOViV9Pn8tS0mq0JfzYh#scrollTo=lBamXNwZOLUk

 

Google Colab Notebook

Run, share, and edit Python notebooks

colab.research.google.com

 

[깨알 팁- 구글 드라이브에서 깃클론하기]

더보기
더보기


네, Google Colab에서 Google Drive에 Git 저장소를 클론할 수 있습니다. 이를 위해 Google Drive를 Colab 환경에 마운트(mount)하고, 그 후에 Git을 사용하여 원하는 저장소를 클론할 수 있습니다. 아래 단계에 따라 진행해 보세요.

단계별 가이드

  1. Google Colab 열기: Google Colaboratory의 웹 애플리케이션을 엽니다.
  2. Google Drive 마운트: Google Drive를 Colab에 마운트합니다. 아래 코드를 실행하면 인증 절차가 진행됩니다.
python
Copy
from google.colab import drive
drive.mount('/content/drive')
  1. Git 클론 명령어 입력: 이제 원하는 Git 저장소를 클론할 준비가 되었습니다. !git clone 명령어를 사용하고, 클론한 저장소를 Google Drive의 원하는 경로에 저장할 수 있습니다.
python
Cop
!git clone https://github.com/username/repository.git /content/drive/MyDrive/클론할_폴더

여기서 username/repository.git 부분은 클론하고자 하는 GitHub 저장소의 URL로 변경하고, /content/drive/MyDrive/클론할_폴더는 클론할 위치로 원하는 경로를 설정합니다.

  1. 실행: 셀을 실행하면 지정한 폴더에 Git 저장소가 클론됩니다.

주의 사항

  • Google Drive에 클론한 후에는 Drive에서 해당 파일에 직접 접근할 수 있습니다.
  • Private 저장소를 클론하려면 인증이 필요합니다. SSH 키나 개인 Access Token을 활용할 수 있습니다.

이렇게 하면 Google Drive에 Git 저장소를 효과적으로 클론할 수 있습니다. 추가적인 질문이 있으면 언제든지 말씀해 주세요!

 

remind

  • 이름 나누기
  • pivot_table
    • 피벗 테이블(Pivot Table)은 데이터 집합에서 특정한 정보를 요약하고 분석하는 데 사용되는 데이터 정리 도구입니다. 주로 스프레드시트 프로그램(예: Microsoft Excel)에서 사용되며, 대량의 데이터를 동적으로 정리하여 다양한 관점에서 분석할 수 있도록 해줍니다. 사용자는 행과 열의 필드를 설정하여 데이터를 요약하고, 합계, 평균, 개수 등의 정보를 쉽게 확인할 수 있습니다.
    • 피벗 테이블을 통해 복잡한 데이터 세트를 분석하는 과정이 간소화되며, 사용자 맞춤형 보고서를 생성하고, 패턴이나 인사이트를 발견하는 데 유용합니다
    • pivot: 축, 회전하다,전환하다, 새로운 전략 시도
  • df.rename() : col 명 바꾸기
  • train_test_split 나누는 방식? < 이해가 안감
  •  pd.merge()
  • df.groupby(col).agg(agg_dict)
  • 중요한 col 다시 합쳐서 새 feature 만들기
  • tqdm 테크덤 : Progress Bar 엄청 중요!!