For AI Modeling

Modularization(모듈화)

프로그래밍 언어(자바 제외)에서는 모듈을 기능(함수)별로 나누거나 모아놓은 파일로써 필요할 때마다 가져다 쓸 수 있도록 재사용하기 위한 것으로 정의합니다. 오늘은 이러한 모듈의 개념과, 하나의 jupyter notebook을 모듈화한 예시를 살펴보겠습니다.

[Data Format①] Parquet(파케이)

kaggle 등 대회를 참여하다보면 parquet라는 형식으로 된 파일들이 간혹 보입니다. csv에 비해서 parquet파일은 용량이 대체로 큰데, 이 parquet가 어떤 데이터 형식이며 어떤 경우에 사용이 되는지 알아보겠습니다.