Posts by Category

Data Analysis

조용한 사직(Quiet Quitting)을 어떻게 정의할 수 있을까?

조용한 사직(Quiet Quitting)이라는 단어를 알고 계시나요? 이 단어는 2009년 경제학 심포지엄에서 처음 등장했지만, 유행은 2022년 7월부터 했습니다. 이 단어가 무엇이고, 어떻게 정의해야할까요? 어떻게 정의해야 이것과 관련한 데이터 분석을 잘 할 수 있을까요?

Back to top ↑

For AI Modeling

Modularization(모듈화)

프로그래밍 언어(자바 제외)에서는 모듈을 기능(함수)별로 나누거나 모아놓은 파일로써 필요할 때마다 가져다 쓸 수 있도록 재사용하기 위한 것으로 정의합니다. 오늘은 이러한 모듈의 개념과, 하나의 jupyter notebook을 모듈화한 예시를 살펴보겠습니다.

[Data Format①] Parquet(파케이)

kaggle 등 대회를 참여하다보면 parquet라는 형식으로 된 파일들이 간혹 보입니다. csv에 비해서 parquet파일은 용량이 대체로 큰데, 이 parquet가 어떤 데이터 형식이며 어떤 경우에 사용이 되는지 알아보겠습니다.

Back to top ↑

Recommender System

Recbole

대다수 모델은 스스로 구현해보는게 가장 좋지만, 많은 종류의 모델 중에 어떤 것을 어떻게 구현해야할지 고민이 되는 경우가 있습니다. 그래서 다수의 모델을 쉽게 사용하기 위해 모아놓은 라이브러리들이 있는데, 오늘은 각종 추천시스템 모델을 구현해놓은 Recbole에 대해 알아보겠습니다.

Back to top ↑

Algorithm

LCS 알고리즘

LCS라는 알고리즘에 대해 알고 계신가요? LCS는 최장 공통 부분문자열(Longest Common Substring) 또는 최장 공통 부분수열(Longest Common Subsequence)을 의미합니다. 같은거 아니냐구요? 다릅니다. 어떻게 다른지 한 번 알아보도록 하겠습니다.

Back to top ↑

Time Series

DTW(Dynamic Time Warping)

뇌과학연구실에서 일할 때, 서로 다른 뇌파 인식 기기가 측정한 뇌파의 시간 차이를 계산하기 위해 DTW라는 알고리즘을 사용한 적이 있습니다. 오늘은 이 DTW에 대해 포스팅해보도록 하겠습니다.

Back to top ↑