최근 들어 기업에서 정말 많이 사용하고 있는 데이터분석 툴 중 하나인 태블로에 대해 알아보고 설치부터 데이터연동까지 태블로를 사용하기 위한 기초 지식을 공부해보고자 합니다.
태블로는 스탠포드에서 진행된 컴퓨터공학 프로젝트가 결실을 맺어 2003년 설립된 회사로, 직곽적인 인터페이스를 제공하여 드래그 앤 드롭 방식을 통해 쿼리 없이 데이터 쿼리로 변환함으로써 데이터를 분석할 수 있는 툴입니다.
태블로 장점
태블로 장점 첫번째로 위에서 설명 드린 것과 같이 코딩 없이 간단한 끌어 놓기 방식으로 데이터를 분석할 수 있다는 것입니다. 따라서 쿼리를 직접 작성 할 수 없어도 원하는 데이터 추세 및 이상값 등을 발견하고 자연어를 사용하여 질문하고 즉시 답을 구할 수 있습니다.
두번째로는 스프레드시트, 데이터베이스, 빅데이터 등 데이터유형과 상관없이 원하는 데이터에 쉽게 연결할 수 있고 데이터 웨어하우스, 클라우드 데이터에 접근하여 연결할 수 있습니다.
세번째로는 데이터의 시각화입니다. 태블로는 시각화를 통해 모든 사람들이 쉽게 데이터를 접근하고 분석할 수 있도록 한다는 목표에 맞게 감각적이고 뛰어난 시각화 기능을 제공합니다.
네번째는 강력한 대화형 대시보드를 만들 수 있다는 것입니다. 또한 태블로 온라인 또는 태블로 서버로 데이터와 대시보드를 안전하게 공유하여 조직의 모든 사용자가 브라우저, 태블릿, 스마트폰으로 바로 질문과 답을 얻을 수 있습니다.
마지막으로 태블로의 커뮤니티입니다. 태블로는 백만이 넘는 활동적이고 다양하며 참여도가 높은 회원들이 커뮤니티를 통해 서로의 분석 방법과 시각화 방법 등을 공유하고 있고 이를 통해 많은 정보를 얻을 수 있고 공부할 수 있습니다.
상품
태블로를 처음 시작하기 위해 사이트에 들어가면 생각보다 많은 제품들이 있어 어떤 것을 설치해야 할지 잘 모를 수 있기 때문에 제품에 대해서 간단하게 설명드리겠습니다.
첫번째로 조직 내 가장 많은 사람들이 사용할 제품으로 태블로 데스크톱입니다. 태블로 데스크톱은 데이터 액세스, 시각화, 분석에 필요한 기능을 제공합니다. 태블로 데스크탑은 유료 프로그램으로 14일 무료 평가판 사용 후에는 태블로를 사용할 수 있는 라이선스를 구매해야 합니다.
두번째로는 태블로 퍼블릭입니다. 퍼블릭은 온라인에서 데이터 시각화를 탐색하고 생성하고 공개적으로 공유하기 위한 무료 플랫폼으로 데스크탑과 가장 큰 차이는 데스크탑의 경우 작업 결과를 PC에 저장할 수 있지만 퍼블릭은 온라인 계정의 클라우드 공간에만 저장 가능하다는 것입니다.유료 상품인 데스크탑과 비교 시 사용 불가능한 기능들이 있지만 태블로에 대해 학습하기에는 충분하기 때문에 앞으로 포스팅은 퍼블릭을 이용해서 하려고 합니다.
세번째로 데이터를 전처리 할 수 있는 태블로 Prep입니다. Prep은 태블로 내에서 분석을 위한 데이터를 더 쉽고 더 빠르게 결합, 변형, 정리할 수 있는 기능을 제공합니다.
네번째로 조직 간 대시보드와 데이터를 공유하고 탐색, 공동작업 할 수 있는 기능을 제공하는 태블로 서버/클라우드가 있습니다. 태블로 서버와 클라우드의 차이점을 간단히 말씀드리면, 사내에서 사용하는 데이터 서버가 온프레미스 환경일 경우 태블로 서버를 사용하며, 아닐 경우 태블로 클라우드를 주로 사용합니다.
이 외에도 Data Management, GPT, Server Management 등이 있습니다.
설치하기(Tableau Public)
우선 태블로 퍼블릭을 설치해 보겠습니다. 태블로 사이트에 들어간 후 제품 > Tableau Public으로 들어가서 맨 첫페이지 상단에 노출된 파란색 버튼 Tableau Public으로 이동을 클릭하면 Public 사이트로 이동하게 됩니다.
이동 후 간단한 인적사항을 기입하고 테스크톱 퍼블릭 버전을 설치합니다.
경로 : 태블로 사이트 > 홈 > 플랫폼 > 제품 > Tableau Public > “Tableau Public으로 이동” 클릭
.> 태블로 퍼블릭 사이트로 이동 후 “Tableau Public에 등록” > 이름과 이메일주소를 입력하면 설치파일 다운로드 가능
데이터 연결하기
위에서 언급했지만 태블로는 다양한 유형의 데이터를 쉽고 빠르게 연결할 수 있는 장점이 있습니다. 태블로를 처음 실행하면 데이터를 연결하는 창이 먼저 뜨고 어떤 방식으로 데이터를 연결할지 선택할 수 있습니다. 데이터 연결 방법으로는 총 세가지로 “파일에 연결”, “서버에 연결”, “저장된 데이터 원본” 이 있습니다.
첫번째 파일에 연결을 통해 엑셀, JSON, 텍스트 파일 등 다양한 파일을 연결할 수 있고, 두번째 “서버에 연결”을 통해 구글 빅쿼리, 구글 클라우드SQL, Cloudera Hadoop, MySQL 등 다양한 데이터를 연결할 수 있습니다. 마지막으로 저장된 데이터 원본을 통해 태블로에 있는 데이터를 연결할 수 있습니다.
태블로를 공부하기 위해 다양한 서적과 인터넷 강의가 있지만 우선 태블로 홈페이지에서 제공하는 학습방법을 따라 태블로를 익혀보려고 합니다. 위에서 말씀드린 것처럼 태블로 커뮤니티가 잘 형성되어 있어 다양한 방식으로 공부하고 습득할 수 있음을 말씀드렸지만 이외에도 태블로 자체적으로 제공하는 학습만 습득해도 태블로를 업무에 이용하기에는 충분하기 때문에 태블로 제공 강의를 통해 습득하려고 합니다.
첫번째 학습으로 태블로 퍼블릭에서 제공하는 학습 커리큘럼에 따라 대화형 대시보드를 구축하면서 기본적인 개념과 용어를 습득하려고 합니다.
태블로 퍼블릭은 몇가지 안되는 방식의 데이터 연결 방식만 제공되며,
데이터 연결을 위해 “슈퍼스토어” 샘플 엑셀데이터를 다운로드 받은 후,
파일에 연결 항목 중 “Microsoft Excel”을 클릭하여 다운로드 받은 경로에서 엑셀데이터를 클릭하는 간단한 방식으로 데이터를 연결했습니다.
이같이 간단한 방식으로 파일을 연결 가능하며, 연결 완료된 화면은 아래와 같습니다.
화면에서 보면 알 수 있듯이 엑셀 파일내 각 시트가 한 개씩 데이터로 구성되며 해당 시트를 끌어서 메인화면으로 가져가면 데이터가 열리고 확인할 수 있습니다
오늘은 이같이 태블로란 무엇인지, 장점은 어떤점이 있는지와 간단히 연결하는 방법을 알아보았습니다. 앞으로 태블로에서 제공하는 학습방식을 따라가면서 태블로에 대해 계속 포스팅하려고 합니다.