실용 SQL

데이터 분석에 꼭 필요한 SQL 실무 노하우

 

데이터라는 단어의 사전적 의미는 ‘이론을 세우는 데 기초가 되는 사실. 또는 바탕이 되는 자료’입니다. 이러한 데이터는 보통 관찰이나 실험, 조사로 얻어집니다. 하지만, 일반적으로 IT 관점에서 풀이한 ‘컴퓨터가 처리할 수 있는 문자, 숫자, 소리, 그림 따위의 형태로 된 정보’라고 이해하는 사람이 더 많습니다. 최근 들어 데이터 분석, AI 등의 기술과 함께 데이터의 양과 중요성을 더 많이 이야기 하기 때문입니다. 그리고, 이러한 데이터를 저장하고, 처리, 관리하는데에도 많은 기술이 필요합니다.

‘데이터베이스’란 컴퓨터 시스템에 전자 방식으로 저장된 구조화된 정보 또는 데이터의 체계적인 집합입니다. 데이터베이스에 저장되는 데이터는 일반적으로 표 형태의 행과 열로 모델링되어 저장됩니다. 이런 모델링 구조로 저장된 데이터베이스에서 구조화된 질어 언어(SQL)를 통해 데이터를 쉽게 생성하고, 읽고, 수정하고, 삭제 할 수 있습니다. 데이터는 ‘데이터베이스 관리 시스템(DBMS)’을 통해 운영됩니다. SQL은 DBMS에서 데이터를 조작하는 것 외에 제어하고, 성능을 관리하고, 체계화와 같은 일도 가능합니다.

SQL은 ANSI SQL 이라는 표준이 있습니다. 하지만, DBMS를 만드는 제조회사별로 조금씩 서로다른 기능을 하는 SQL 구문이 추가되어 만들어져 사용됩니다. 표준이라는 비슷한 구문을 가지고 있지만, 각각의 제조업체별 SQL의 함수를 아는 것이 데이터 처리를 빨리 할 수 있는 요소로 중요해졌습니다. 최근 인기를 얻고 있는 PostreSQL은 그나마 표준을 잘 지키는 DBMS로 알려져 있습니다.

 


실용 SQL PostgreSQL로 시작하는 데이터 스토리텔링 가이드북
앤서니 드바로스 저/임소정, 강민혁 역 | 영진닷컴 | 2023년 01월 30일

 

데이터를 분석하기 위해서는 저장된 데이터 중 분석에 필요한 데이터만을 잘 선택하여 가져오는 것이 필요합니다. SQL이 필요한 이유이기도 합니다. 또한, SQL을 이해하면 데이터를 저장할 때부터 어떤 식으로 저장하면 더 빠르게 필요한 데이터를 가져올 수 있을까도 생각하게 됩니다.

이 책은 PostgreSQL이라는 DBMS에 저장된 데이터를 빠르게 꺼내어 분석할 수 있도록 안내하는 SQL 학습서 입니다. SQL을 바로 이야기 하기 보다 프로그래밍을 처음 접하는 사람들을 고려하여 데이터베이스에 대한 주요 배경부터 시작합니다.


컴퓨터 설정법을 시작으로 데이터베이스의 기초가 되는 테이블, 데이터셋을 설명합니다. 기초적인 SQL쿼리를 통해 데이터를 정렬하고 필터링 하는 법을 배우고, 조금씩 SQL 명령어와 함수를 더해가면서 실제 데이터를 기반으로 실습을 통해 실력을 높일 수 있도록 구성되어 있습니다.

특히, 13장 이후의 고급 쿼리를 활용한 다양한 실습 예제는 SQL의 확장성에 대해 이해할 수 있습니다. 흔히 SQL은 데이터를 다루는 프로그래밍에서는 기본이라고 쉽게 생각하는 편입니다. 하지만, SQL도 이렇게 깊게 파고들면 쉬운 면 보다는 실무에 활용할 수 있는 다양한 방법을 확인할 수 있습니다. 데이터 분석을 위한 SQL에서는 바로 이러한 부분때문에 계속 사용되는 이유입니다.

PostgreSQL은 데이터가 많아 쿼리가 복잡해질 때 다른 DBMS 보다 빠른 성능을 보여주는 것으로 알려져 있습니다. 이렇게 PostgreSQL을 알고 있으면 간단한 쿼리 부터 기업용 대용량 데이터 처리도 가능합니다.

책의 마지막에는 데이터 스토리텔링 프로세스를 소개하고 있습니다. 분석을 위한 아이디어 생성, 데이터 검토, 명확한 결과를 내기 위한 지침입니다. 질문으로 시작하고, 과정은 문서화해야 합니다. 데이터는 모아야 되며, 없으면 만들어야 됩니다. 수집한 데이터는 출처를 확인해야 하며, SQL을 통해 데이터와 인터뷰해야 합니다. 이렇게 모인 데이터에 대해 다시 확인을 받고, 추세를 파악한 후, 원인을 알아냅니다. 마지막으로 이러한 프로세스를 통해 알아낸 분석 결과는 공유를 해야 합니다. 바로 데이터 분석업무의 과정이 이러할 것입니다.

데이터를 어느 한 곳에 정리해서 모아두면 언제든지 보고 싶은 정보를 빠르게 꺼내볼 수 있고, 여러가지 사실을 분석하여 새로운 정보를 얻어낼 수 있습니다. 이때 꼭 필요한 프로그래밍 언어가 SQL 입니다. SQL 중에서도 PostgreSQL에 대해 제대로 공부하고 싶을 때, 혹은 업무 중에 필요한 부분을 찾고 싶을 때 꺼내 볼 수 있는 책이 바로 <실용 SQL> 책 입니다. 그리고, PostgreSQL을 배우고 나면 표준 ANSI SQL 기반의 다른 DBMS에서도 바로 사용할 수 있습니다. SQL 책이 필요할 때 이 책 한권이면 충분할 것입니다.

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.