Database
Chapter 6-34. Mini Project : 예스24 베스트셀러 데이터 수집 후 데이터 분석하기(5/7)
Chansman
2025. 3. 25. 14:13
📌 개념 정리
이번 포스팅에서는 MySQL을 활용하여 수집한 베스트셀러 데이터를 분석하는 다양한 SQL 쿼리 예시를 정리했습니다. 초보자도 쉽게 따라 할 수 있도록 쿼리별로 구체적인 목적과 활용법을 설명합니다.
🚦 데이터 분석을 위한 SQL 쿼리
🔍 기본 조회 및 필터링
모든 책의 제목과 저자를 조회하기
SELECT title, author FROM Books;
평점이 4점 이상인 책 목록 조회하기
SELECT title, rating FROM Books WHERE rating >= 4;
리뷰 수가 100개 이상인 책의 제목과 리뷰 수 조회하기
SELECT title, review FROM Books WHERE review >= 100;
가격이 20,000원 미만인 책의 제목과 가격 조회하기
SELECT title, price FROM Books WHERE price < 20000;
국내도서 TOP100에 4주 이상 머문 책 조회하기
SELECT title, ranking_weeks FROM Books WHERE ranking_weeks >= 4;
특정 저자의 모든 책 조회하기
SELECT title FROM Books WHERE author = '저자명';
특정 출판사의 모든 책 조회하기
SELECT title FROM Books WHERE publisher = '출판사';
🔗 조인 및 관계 분석
저자별 출판한 책의 수 조회하기
SELECT author, COUNT(*) FROM Books GROUP BY author;
가장 많은 책을 출판한 출판사 찾기
SELECT publisher, COUNT(*) AS num_books FROM Books GROUP BY publisher ORDER BY num_books DESC LIMIT 1;
가장 높은 평균 평점을 가진 저자 찾기
SELECT author, AVG(rating) AS avg_rating FROM Books GROUP BY author ORDER BY avg_rating DESC LIMIT 1;
국내도서 랭킹 1위인 책의 제목과 저자 조회하기
SELECT title, author FROM Books WHERE ranking = 1;
판매지수와 리뷰 수가 높은 상위 10권 책 조회하기
SELECT title, sales, review FROM Books ORDER BY sales DESC, review DESC LIMIT 10;
가장 최근 출판된 5권의 책 조회하기
SELECT title, publishing FROM Books ORDER BY publishing DESC LIMIT 5;
🧠 고급 팁
- 쿼리 결과에 인덱스를 적절히 사용하면 성능을 크게 개선할 수 있습니다.
- 복잡한 쿼리는 뷰(View)로 만들어 재사용성과 유지보수를 쉽게 할 수 있습니다.
✅ 마무리 요약 및 복습 포인트
- 필터링 및 조건을 이용한 기본적인 데이터 조회 방법을 숙지하세요.
- GROUP BY와 ORDER BY를 활용해 원하는 기준으로 데이터를 그룹화하고 정렬하는 방법을 이해하세요.
- 분석 목적에 맞게 다양한 조건을 조합하여 데이터를 더욱 유용하게 활용할 수 있습니다.
이 예시 쿼리들을 참고하여 효과적인 데이터 분석을 진행해 보시기 바랍니다!