개발지식 아카이브/Data - ETC

Zeppelin 과 Notebook 비교, 어떤 것을 고를까?

민서_Soya 2023. 5. 18. 08:52

 

 

Zeppelin 은

데이터 분석과 시각화를 위한 인터랙티브한 환경을 제공하는 Web Notebook 기반의 오픈 소스 프로젝트


 

Zeppelin을 쓰는 이유

  1. 인터랙티브한 환경
    실시간으로 코드를 실행하고 결과를 확인할 수 있는 대화형 환경 -> 분석의 효율성
  2. 다중 언어 지원
    다양한 언어로 코드를 작성하고 실행할 수 있음 -> 사용자가 선호하는 언어 선택 가능
    ex) HDFS에 접근하고자 할 때에 상황에 맞게 Hive query 를 작성할 수도, Presto query를 작성할 수도 있다. Python, Scala등의 다양한 언어를 섞어가며 분석 코드를 짤 수 있고, Spark, Cassandra 등 다양한 분석 도구에도 붙을 수 있다.
  3. 시각화 기능
    데이터 시각화를 위한 다양한 도구와 라이브러리를 지원하여 결과를 직관적으로 시각화 -> 데이터의 패턴 & 인사이트를 빠르게 파악
  4. 공유와 협업
    Zeppelin은 노트북 형식으로 작업을 저장하고 공유할 수 있으며, 다른 사용자와 협업하여 분석 작업을 진행할 수 있다.
    -> 팀 프로젝트나 지식 공유에 유용하게 활용

 

Apache Zeppelin VS Jupyter Notebook 

Zeppelin 이 선호되는 경우

  • 팀 프로젝트나 협업 작업
  • 다중 언어 지원이 필요함
  • 보안 인증 기능의 구현이 필요함
    - 사용자의 개인정보 구성이 없는 주피터와 달리 제플린은 유연한 보안구성이 가능

 

Jupyter Notebook 이 선호되는 경우

  • 개인적인 데이터 분석 작업이나 학습
  • Scalable 한 인프라 구축이 필요한 경우
    - Docker, k8s 를 지원함
  • 커뮤니티의 지원이 필요한 경우
    - 제플린보다 더 오래되었고 사용자수가 더 많음

 

2023년 5월 기준의 Google trend. 주피터 노트북의 관심도가 더 높으며 시간이 지날수록 차이가 커지고 있다.


 

Reference

https://medium.com/apache-zeppelin-stories/%EC%98%A4%ED%94%88%EC%86%8C%EC%8A%A4-%EC%9D%BC%EA%B8%B0-2-apache-zeppelin-%EC%9D%B4%EB%9E%80-%EB%AC%B4%EC%97%87%EC%9D%B8%EA%B0%80-f3a520297938

 

오픈소스 일기 2: Apache Zeppelin 이란 무엇인가?

이번시간엔 필자가 Contribute하고 있는 오픈소스 프로젝트인 아파치 제플린(Apache Zeppelin)에 대해서 다뤄보도록 하겠다. 이미 잘 알고 계시는 분들보다 이것이 뭔지 잘 모르는 분들의 이해를 돕고

medium.com

 

https://www.intelligencelabs.tech/69dd1f0e-67c9-4969-8615-a810d74056ca

 

데이터 분석 도구 고르기 : Apache Zeppelin vs Jupyter

Table of contents

www.intelligencelabs.tech

https://analyticsindiamag.com/jupyter-vs-zeppelin-a-comprehensive-comparison-of-notebooks/