Recent posts

Recbole

대다수 모델은 스스로 구현해보는게 가장 좋지만, 많은 종류의 모델 중에 어떤 것을 어떻게 구현해야할지 고민이 되는 경우가 있습니다. 그래서 다수의 모델을 쉽게 사용하기 위해 모아놓은 라이브러리들이 있는데, 오늘은 각종 추천시스템 모델을 구현해놓은 Recbole에 대해 알아보겠습니다.

DTW(Dynamic Time Warping)

뇌과학연구실에서 일할 때, 서로 다른 뇌파 인식 기기가 측정한 뇌파의 시간 차이를 계산하기 위해 DTW라는 알고리즘을 사용한 적이 있습니다. 오늘은 이 DTW에 대해 포스팅해보도록 하겠습니다.

Modularization(모듈화)

프로그래밍 언어(자바 제외)에서는 모듈을 기능(함수)별로 나누거나 모아놓은 파일로써 필요할 때마다 가져다 쓸 수 있도록 재사용하기 위한 것으로 정의합니다. 오늘은 이러한 모듈의 개념과, 하나의 jupyter notebook을 모듈화한 예시를 살펴보겠습니다.

[Data Format①] Parquet(파케이)

kaggle 등 대회를 참여하다보면 parquet라는 형식으로 된 파일들이 간혹 보입니다. csv에 비해서 parquet파일은 용량이 대체로 큰데, 이 parquet가 어떤 데이터 형식이며 어떤 경우에 사용이 되는지 알아보겠습니다.