spark Spotify API의 response 데이터(.json)을 가공하여 .parquet 데이터를 생성하는 상시 동작 어플리케이션입니다. Kafka 채널을 구독하고 있으며, 해당 채널에 발행된 메세지를 기반으로 데이터 가공 작업을 수행합니다. Structure Environments Ubuntu v22.04 LTS Python v3.12.0 Spark v3.5.0 Results 생성된 .parquet 데이터는 AWS S3 버킷 내부에 적재됩니다.