Computer Science/Database
-
[MongoDB] MongoDB란?Computer Science/Database 2024. 1. 3. 01:11
기존의 사용하던 RDB는 당시 Disk Storage가 매우 고가의 제품이라 데이터 중복을 줄이는데 집중했다. 방대한 양의 데이터를 처리하기 위해서 성능 향상이 필요했지만 수직적 확장의 경우 비용이 많이 소모되고, 수평적 확장의 경우 관계 테이블을 모두 동일한 서버에 보관해야했기에 확장이 어려웠다. 이후 Disk Storage가 더이상 큰 이슈가 아니게 되면서 데이터베이스의 확장성과 성능을 위해 NoSQL이 등장했다. NoSQL은 RDB가 하지 못했던 것들을 해결하며 다양한 장점을 제공한다. 데이터 가시성이 좋고 Join없이 조회할 수 있어 읽기 성능, 응답 속도가 빠르다. 스키마가 유연해서 어플리케이션의 요구사항에 맞게 데이터를 수용할 수 있다. Scale-Out이 간편하다. 역정규화에 따라 데이터 중..
-
[Kafka] 아파치 카프카(Apache Kafka)에 대해서Computer Science/Database 2023. 12. 20. 01:49
어플리케이션에 사용자가 많아지며 트래픽이 증가하고, 요청에 대한 추가작업이 많아질 때 빠른 응답과 성능을 위해 메시지 큐를 사용할 수 있다. 메시지큐는 Producer와 Consumer 사이에서 메시지를 저장하고 전달하는 중간 장치로서, 비동기적으로 작동하며 큐에 담긴 메시지를 처리한다. 메시지큐를 포함하는 메시지 브로커로는 RabbitMQ, Redis, ActiveMQ, Kafka 등이 있다. 그 중 Kafka에 대해 알아보자! (메시지 큐를 모른다면 여기로) Kafka는 왜 생겼을까? Kafka(카프카)는 미국의 대표적인 비즈니스 인맥 소셜 네트워크 서비스인 링크드인(LinkedIn)에서 처음 출발한 기술이다. 링크드인 사이트가 성장하면서 발생했던 여러 이슈들을 해결하기 위해 개발되었다. 기존의 링크..
-
[메시지 큐] 메시지 큐에 대해서 (메시지 큐, MOM, 특징, 이점 등)Computer Science/Database 2023. 12. 10. 21:18
MOM (Message Oriented Middleware) MOM은 메시지 지향 미들 웨어로서 어플리케이션의 메시지를 중간에서 관리해주는 시스템이다. 여기서 미들웨어란 무엇일까? 개념적으로 미들웨어는 응용프로그램과 운영체제 사이에서 두 요소간 차이에 상관없이 통신을 가능하게 해주는 계층을 말한다. 분산 컴퓨팅 환경에서 미들웨어는 분산 네트워크에서 애플리케이션 또는 애플리케이션 구성요소 간에 통신을 가능하게 하는 소프트웨어라고 한다. 미들웨어는 다음과 같은 범주로 나눌 수 있다. RPC(Remote Procedure Call) 기반 미들웨어 ORB(Object Request Broker) 기반 미들웨어 MOM(Message Oriented Middleware) 기반 미들웨어 이 중 MOM은 분산 응용 프..
-
[Redis] Redis에 대해서 (Redis란, 특징, 영속성, 자료구조, 아키텍처)Computer Science/Database 2023. 12. 10. 20:15
데이터와 트랙픽의 양이 기하급수적으로 증가하면서 한대의 관계형 데이터베이스를 사용하는 것은 큰 비용이 든다. 이런 상황에서 NoSQL은 여러 대의 컴퓨터에 데이터를 분산하여 저장하는 것을 목표로 등장했다. NoSQL 데이터베이스 중 하나인 Redis는 key-value 형태로 저장하는 인메모리 데이터 베이스로서 데이터베이스 뿐만 아니라 캐시, 메시지 브로커 및 스트리밍 엔진 등 다양한 용도로 사용되는 오픈소스이다. Redis에 대해서 자세히 알아보자! 📍 Redis란? Redis는 Remote Dictionary Server의 약자로 외부 딕셔너리(key-value) 형태의 서버이다. NoSQL 데이터베이스 중 하나로 고급 키-값 저장소이다. In-Memory 데이터 베이스로서 memcached와 유사한..
-
[SQL] 집계 함수를 쓰기 어려울 때 over()와 서브 쿼리 중 뭐를 사용해야 할까?Computer Science/Database 2023. 10. 13. 17:52
🎈시작 MySQL에서 world database를 사용해 쿼리를 뚱땅거리던 중 다음과 같은 쿼리를 작성해야하는 경우가 있었다. 어떤 데이터에 대한 조회를 해야할 때 각 튜플의 데이터를 확인하면서 튜플이 속한 그룹의 평균 값을 확인하고 싶은 경우가 있었는데 (예를 들자면 전체 학생을 조회할 때 학생이 속한 반의 평균 키를 함께 조회하고 싶은 경우...) 여기서 over와 서브쿼리를 사용하며 알게된 점을 작성해보려고 한다. 🧩 서브 쿼리와 OVER() 본문에 들어가기 전 서브 쿼리와 OVER() 가 무엇인지 알아보자 서브 쿼리 서브 쿼리란 SQL 쿼리 내에서 다른 SQL 쿼리의 일부로 사용되는 쿼리이다. 즉, 하나의 쿼리 안에 다른 SQL 쿼리가 포함되는 것! 예를 들어, 도시 테이블에서 전체 인구 평균 이..
-
[SQL] JOIN 정리Computer Science/Database 2022. 7. 14. 17:49
JOIN 두 개 이상의 테이블들을 공통 필드를 가지고 통합하는 SQL언어 star schema로 구성된 테이블로 분산되어있던 정보를 통합하는데 사용 JOIN의 결과롤 양쪽의 필드를 모두 가진 새로운 테이블이 생성됨 JOIN의 종류 JOIN 시에는 중복 레코드가 없고 primary key와 uniqueness가 보장됨을 체크 조인하는 테이블들 간의 관계를 명확히 정의 one to one : 완전한 one to one / 한쪽이 부분집합이 되는 one to one one to many : 중복 문제가 발생할 수 있음 many to one : one to many와 동일 many to many : 가능하다면 one to many와 one to one으로 변경하여 조인 어떤 테이블을 베이스로 둘 것인지 결정 I..
-
[SQL] DMLComputer Science/Database 2022. 7. 14. 17:32
SQL DML DML: Database Manipulation Language 데이터베이스 테이블 조작언어로 레코드 조회, 삽입, 수정, 삭제를 가능하게 하는 SQL 언어 SELECT, INSERT, DELETE, UPDATE 1. INSERT 테이블에 레코드를 삽입하는 명령어로 2가지 방식이 존재 1) 필드 지정 INSERT INTO table_name (field1, field2, field3) VALUES(value1, value2, value3); 2) 필드 지정 X 모든 필드에 대해 값을 지정하는 경우 테이블에 정의된 순서대로 값을 입력 INSERT INTO table_name VALUES(value1, value2, value3, value4) 2. UPDATE 조건을 기반으로 특정 레코드(들..