MYSQL

[MYSQL] Replication 이란?

상혜 2020. 7. 5. 14:36

 

 

주문이 이뤄지고,결제가 이뤄지는 서비스를 운용하면서 가장 중요한 것이 가맹점이 볼 수 있는 시각화된 데이터입니다.

이러한 통계 데이터를 실제 운용되는 Source DB 에서 바로 가져오는 것은 상당한 무리가 갈 수 있습니다.

특히, 한 테이블에서 바로 가져오는 것이 아니라 여러 테이블을 조인하여 조합 후 가져오는 형태라면 더더욱 부하가 발생합니다.

이러한 문제를 해결하기 위한 방법 중 하나가 바로 Replication 입니다.

Mysql 공홈에서는 Replication 에 대해서 다음과 같이 설명하고 있습니다.

Replication enables data from one MySQL database server (known as a source)
 to be copied to one or more MySQL database servers (known as replicas).
 Replication is asynchronous by default; replicas do not need to be connected 
permanently to receive updates from a source. Depending on the configuration,
 you can replicate all databases, selected databases, or even selected tables
 within a database.
        

설명드리면 Replication 은 하나 또는 하나 이상의 MySQL database 서버에 특정 MySQL database 서버를 복사할 수 있는 기능입니다. 기본적으로는 asynchronous(비동기) 로 실행이 되며, 영구적으로 연결되어 수정되지 않아도 됩니다. 또한, 모든 databases 단위가 아닌 특정 database 나 심지어 table 단위로도 가능합니다.

이처럼 Source database 를 기점으로 똑같은 Replica database 를 가지고 싶은 경우 주로 사용하게 됩니다.

 

 

 

장점

Replication 의 장점은 다음과 같습니다.

  1. Scale-out solucations
    • 부하를 여러개의 replicas 에게 분산시켜줍니다. 모든 writes 와 update 는 source server 로 부터 발생시키고, reads 는 replicas 로부터 발생시킵니다. 이러한 모델은 wrtie 와 read 를 나눔으로 써 성능을 극대화 시켜줍니다.
  2. Data security
    • replica 는 replication process 를 중단 시킬 수 있기 때문에 원본의 손상없이 복제를 진행할 수 있습니다.
  3. Analytics
    • live data 는 server source 에서 생성되어지고, 통계를 위한 데이터는 live data 에 영향을 끼치지 않고 replica 에서 생성할 수 있습니다.
  4. Long-distance data distribution
    • 원격의 사이트에 사용하기 위한 데이터를 본 server 에 별다른 접속 없이 복사할 수 있습니다.

 

 

 

Replication method 종류

MySQL 은 Replication 을 위한 다른 방법들을 제공합니다.

전통적인 방법으로는 source`s binaly log 를 기반으로한 replicating event 입니다.

이 방법은 log files 와 source 와 replica 사이에 synchronize 한 순간을 필요로 합니다.

source 가 Data 가 create 나 modify 가 되는 순간 binary log 를 작성하게 되며, replica 는 이러한 binaly log 를 읽어 복제하는 방식입니다.

장점으로는 Source 는 create 나 modify 되었을 때 binary log 를 쓰기면 하면 되고, replica 는 이러한 binary log 를 읽어 가기만 하면 되기 때문에 replica 가 다량인 경우 부하가 적을 수 있습니다.

단점으로는 binary log 를 쓰는 시점과 읽는 시점에 텀이 생길 수 있기 때문에 consistency 를 보장할 수 없습니다.

또한, binary log 를 생성하기 때문에 binary log 를 위한 메모리가 필요하게 됩니다.

이러한 consitency 를 보장하기 위해서 새롭게 제공하는 방법은 Global Transcation Identifiers(GTIDs) 입니다.

GTIDs 는 trancsactional 을 기반으로 운용되며, log files 나 이러한 files 를 위한 읽어가는 기능을 필요로 하지 않습니다.

    

GTIDs 는 Source 를 적용하는 모든 transcations commited 을 기반으로 replica 에 적용되기 때문에 Consistency 를 보장할 수 있습니다.

GTIDs 에 대한 자세한 설명은

https://dev.mysql.com/doc/refman/8.0/en/replication-gtids.html

를 참고 부탁드립니다.

 

 

 

Replication 의 synchronization 종류

Replication 은 다른 synchronization type 을 제공합니다.

우선 기본적은 type 은 하나의 source server 로 운용되는 형태로 one-way asynchronous 방법이며, 하나 또는 여러개의 server 가 replicas 로 운용되는 구조입니다.

이러한 방법은 NDB Cluster 의 특색인 synchronous replication 과 대조적인 방법입니다.

MySQL 8.0 에서는 asynchronous replication 을 기반인 semisynchronous replication 을 지지합니다.

simisynchronous replication 은 session 이 transaction 의 log event 가 받았다는 것을 인지하고 돌아오기 전에 commit 이 source block 에 실행되는 구조입니다.

자세한 내용은 https://dev.mysql.com/doc/refman/8.0/en/replication-semisync.html 에서 참고 부탁드립니다.

 

 

 

Format

MySQL 에서는 binary log 를 쓰는 2가지의 핵심 type 을 제공합니다.

전체적인 SQL 문을 작성하는Statement Based Replication(SBR) 과 오직 변화된 row 만 기록하는 Row Based Replication(RBR) 입니다.

또한 두가지를 섞어서 Mixed Based Replicatoin(MBR) 로 사용할 수 있습니다.

(MySQL 에서는 GTIDs 를 사용할 땐, SBR 을 사용하면 transcation 에 부하가 생길 수 있기 때문에 RBR 을 권장합니다.)

 

 

 

결론

MySQL 8.0 에서 제공하는 Replication 의 종류와 기능에 대해서 알아봤습니다.

앞에서 설명한 기능 외에도 부가적인 설정이나 기능들을 MySQL 공식 사이트에서 제공하고 있습니다.

통계 데이터를 추출하거나, Source server 에 대한 부하를 줄이거나, 혹시 모르는 상황을 대비하기 위한 방법으로 Replication 을 많이 사용하는데 상황과 필요성에 맞게 Replicatoin 을 이해하고 사용하면 더욱 효율적으로 사용할 수 있습니다.

 

 

참고

- https://dev.mysql.com/doc/refman/8.0/en/replication.html

 

MySQL :: MySQL 8.0 Reference Manual :: 17 Replication

Replication enables data from one MySQL database server (known as a source) to be copied to one or more MySQL database servers (known as replicas). Replication is asynchronous by default; replicas do not need to be connected permanently to receive updates

dev.mysql.com

 - https://sarc.io/index.php/mariadb/1770-mysql-multi-source-replication

 

Mysql multi-source-replication 이란

Tech Note 정보 kimdubi 님이 작성하신 글입니다. 카테고리: [ MariaDB ] 게시됨: 03 November 2019 작성됨: 03 November 2019 최종 변경: 03 November 2019 조회수: 17816 multi source replication 이란? 하나의 slave db서버가 여��

sarc.io

 - https://gywn.net/2011/12/mysql-replication-1/

 

MySQL Replication 이해(1) – 개념 | gywndi's database

Overview 오늘은 조금더 제너럴한 주제를 가지고 정리를 할까합니다. 바로 MySQL Replication 입니다. MySQL Community에서 유일하게 HA 또는 분산 구성을 할 수 있는 유일한 기능입니다. 물론 “MySQL+DRBD 구��

gywn.net

 - https://kamang-it.tistory.com/entry/MySQLReplication%EC%9C%BC%EB%A1%9C-DB-Master-Slave%EA%B5%AC%EC%A1%B0-%EB%A7%8C%EB%93%A4%EC%96%B4%EC%84%9C-%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%8F%99%EA%B8%B0%ED%99%94-%ED%95%98%EA%B8%B0feat-docker-shell-script