Why VM Snapshots Are Unsafe for Transactional Databases

Për inxhinierët DevOps dhe administratorët e sistemeve, snapshot-et e makinerive virtuale (VM) janë një mjet themelor. Ato ofrojnë një mënyrë të shpejtë dhe të përshtatshme për të kapur gjendjen e një serveri përpara një përditësimi (patch) të rrezikshëm, një ndryshimi të madh konfigurimi ose një vendosjeje të një aplikacioni. Nëse diçka shkon keq, rikthimi në gjendjen e mëparshme zgjat vetëm pak sekonda.

Megjithatë, kur kjo metodologji zbatohet në bazat e të dhënave transaksionale—si PostgreSQL, MySQL, Oracle ose Microsoft SQL Server—snapshot-et e VM-ve shndërrohen nga një rrjetë sigurie në një bombë me sahat.

Mbështetja te snapshot-et standarde të hipervizorit për kopjet rezervë (backups) të bazave të të dhënave është një nga shkaqet më të zakonshme të korrupsionit të të dhënave, faqeve të dëmtuara (torn pages) dhe ndërprerjeve të parikuperueshme të prodhimit. Në këtë artikull, ne do të shqyrtojmë përplasjen arkitekturore midis hipervizorëve dhe motorëve të bazave të të dhënave, mekanikën e korrupsionit të të dhënave gjatë snapshot-eve dhe praktikat më të mira inxhinierike të kërkuara për të bërë kopje rezervë të sigurta të bazave të të dhënave të virtualizuara.

Përplasja Arkitekturore: Hipervizorët kundrejt Motorëve të Bazave të të Dhënave

Për të kuptuar pse snapshot-et e VM-ve rrezikojnë bazat e të dhënave, duhet së pari të shqyrtojmë se si të dy sistemet menaxhojnë gjendjen dhe operacionet I/O.

Si i ekzekutojnë Hipervizorët Snapshot-et

Kur një hipervizor (si VMware ESXi, Microsoft Hyper-V ose KVM) bën një snapshot, ai nuk e kopjon diskun. Në vend të kësaj, ai ngrin skedarin aktual të diskut virtual (p.sh., .vmdk ose .vhdx) në një gjendje “vetëm për lexim” dhe krijon një disk të ri delta (disk diferencues). Të gjitha shkrimet pasuese drejtohen te ky disk delta.

Kur snapshot-i fshihet, hipervizori duhet të bashkojë (konsolidojë) të dhënat nga disku delta përsëri në diskun bazë. Snapshot-et standarde nuk janë aspak në dijeni të aplikacioneve që ekzekutohen brenda sistemit operativ të ftuar. Ato kapin gjendjen e diskut saktësisht ashtu siç ekziston në atë mikrosekondë.

Si menaxhojnë Gjendjen Bazat e të Dhënave Transaksionale

Bazat e të dhënave transaksionale janë krijuar rreth vetive ACID (Atomiciteti, Konsistenca, Izolimi, Qëndrueshmëria). Për të arritur performancë të lartë duke ruajtur pajtueshmërinë ACID, bazat e të dhënave nuk shkruajnë çdo transaksion direkt në skedarët kryesorë të të dhënave në disk menjëherë. Në vend të kësaj, ato përdorin një arkitekturë komplekse me shumë nivele:

Buffer Pool / Shared Buffers: Të dhënat lexohen dhe modifikohen brenda memories së sistemit.
Write-Ahead Log (WAL) / Redo Logs: Ndryshimet shkruhen në mënyrë sekuenciale në një skedar log shumë të optimizuar në disk për të siguruar qëndrueshmërinë.
Checkpoints / Lazy Writers: Periodikisht, baza e të dhënave pastron faqet e modifikuara (të ndotura) nga memoria në skedarët aktualë të të dhënave në disk.

Për shkak të kësaj arkitekture, skedarët fizikë të të dhënave në disk janë pothuajse gjithmonë jashtë sinkronizimit me gjendjen aktuale të bazës së të dhënave. Gjendja e vërtetë e bazës së të dhënave ekziston vetëm si një kombinim i skedarëve të të dhënave në disk, log-eve WAL/Redo dhe të dhënave që ndodhen aktualisht në memorie.

Zona e Rrezikut: Çfarë ndodh gjatë një Snapshot-i të VM-së

Kur bëni një snapshot standard të VM-së së një serveri të bazës së të dhënave, ju po kapni një gjendje crash-consistent (konsistente në rast përplasjeje).

Konsistenca në rast përplasjeje kundrejt Konsistencës së Aplikacionit

Një snapshot “crash-consistent” është ekuivalent me heqjen e kabllit të energjisë nga serveri fizik. Gjendja e diskut kapet, por çfarëdo që ishte në memorie humbet dhe çfarëdo që ishte në mes të procesit drejt kontrolluesit të ruajtjes ndërpritet papritur.

Ndërsa bazat e të dhënave moderne janë krijuar për të rikuperuar nga humbja e papritur e energjisë duke riluajtur Write-Ahead Log, mbështetja te rikuperimi nga përplasja si strategjia juaj kryesore e kopjimit rezervë është shumë e rrezikshme. Nëse baza juaj e të dhënave përfshin disqe të shumtë virtualë (p.sh., skedarët e të dhënave në Drive D: dhe WAL në Drive E:), hipervizori mund të mos bëjë snapshot të të dy disqeve në të njëjtën mikrosekondë. Nëse snapshot-i i diskut WAL kapet qoftë edhe një fraksion sekonde pas snapshot-it të diskut të të dhënave, baza e të dhënave nuk mund t’i pajtojë numrat e sekuencës gjatë rikthimit, duke rezultuar në korrupsion fatal.

Efekti “VM Stun” në Sistemet me Transaksione të Larta

Procesi i krijimit të snapshot-it—dhe më e rëndësishmja, procesi i konsolidimit të snapshot-it—shkakton një fenomen të njohur si “VM Stun”.

Për të kaluar në mënyrë të sigurt I/O nga disku bazë në diskun delta, hipervizori duhet të ndalojë shkurtimisht (stun) makinerinë virtuale. Për një server ueb me ngarkesë të lehtë, ky ndalim mund të zgjasë 10-50 milisekonda dhe të kalojë pa u vënë re. Megjithatë, për një bazë të dhënash me xhiro të lartë dhe I/O masiv, konsolidimi i një disku të madh delta mund ta ndalojë VM-në për disa sekonda.

Gjatë një “VM stun”:
* Lidhjet e rrjetit bien, duke shkaktuar “timeouts” të aplikacionit.
* Klusterët me disponueshmëri të lartë (si SQL Server Always On, PostgreSQL Patroni ose MySQL Galera) humbasin kontrollet e “heartbeat”.
* Klusteri mund të supozojë se nyja e ndaluar ka vdekur, duke shkaktuar një dështim (failover) të panevojshëm dhe shkatërrues (skenari split-brain).

Faqet e dëmtuara (Torn Pages) dhe mospërputhja e I/O

Motorët e bazave të të dhënave zakonisht shkruajnë të dhëna në madhësi specifike faqesh (p.sh., 8KB për PostgreSQL dhe SQL Server, 16KB për InnoDB). Megjithatë, sistemi operativ dhe grupet e ruajtjes (storage arrays) përpunojnë I/O në blloqe më të vogla (p.sh., 4KB ose 512 bajt).

Nëse një hipervizor bën një snapshot saktësisht ndërsa baza e të dhënave po shkruan një faqe 8KB, snapshot-i mund të kapë 4KB-të e para të të dhënave të reja dhe 4KB-të e fundit të të dhënave të vjetra. Kjo krijon një faqe të dëmtuar (torn page). Kur përpiqeni të riktheni snapshot-in, baza e të dhënave do të lexojë faqen, do të dështojë vërtetimin e “checksum” dhe do ta shënojë bazën e të dhënave si të korruptuar.

Pasojat në botën reale për motorë specifikë të bazave të të dhënave

Motorë të ndryshëm të bazave të të dhënave reagojnë ndaj snapshot-eve “crash-consistent” në mënyra të ndryshme, por asnjëri prej tyre nuk e menaxhon atë mirë në një mjedis prodhimi.

PostgreSQL: PostgreSQL mbështetet shumë te direktoria pg_wal. Nëse një snapshot kap direktorinë e të dhënave ($PGDATA) dhe WAL jashtë sinkronizimit, PostgreSQL do të dështojë të niset, duke shfaqur një gabim PANIC: could not locate a valid checkpoint record.
MySQL/InnoDB: InnoDB përdor një “doublewrite buffer” për të parandaluar faqet e dëmtuara, gjë që ofron njëfarë mbrojtjeje kundër gjendjeve “crash-consistent”. Megjithat, nëse skedari ibdata1 dhe ib_logfile kapen jashtë sinkronizimit, motori InnoDB do të përplaset gjatë rikuperimit.
Microsoft SQL Server: SQL Server është shumë i ndjeshëm ndaj ngrirjes së I/O. Pa integrimin e duhur të VSS (Volume Shadow Copy Service), rikthimi i një SQL Server nga një snapshot standard i VM-së shpesh do të rezultojë në baza të dhënash të dyshimta dhe zinxhirë të thyer të log-eve, duke shkatërruar aftësitë tuaja të Rikuperimit në një Pikë në Kohë (PITR).

Praktikat më të mira për kopje rezervë të sigurta të bazave të të dhënave të virtualizuara

Për të mbrojtur bazat e të dhënave transaksionale, duhet të kaloni nga kopjet rezervë “crash-consistent” në kopje rezervë të konsistente me aplikacionin. Kjo kërkon që mekanizmi i kopjimit rezervë të komunikojë me motorin e bazës së të dhënave, duke e detyruar atë të pastrojë memorien në disk dhe të ndalojë operacionet I/O përkohësisht ndërsa bëhet snapshot-i.

1. Përdorni “Application-Aware Quiescing” (VSS dhe fsfreeze)

Për Windows (SQL Server):
Sigurohuni gjithmonë që zgjidhja juaj e kopjimit rezervë përdor Microsoft Volume Shadow Copy Service (VSS). Kur aktivizohet një kopje rezervë që njeh VSS, SQL Server VSS Writer ngrin I/O-në e bazës së të dhënave, pastron transaksionet në pritje në disk dhe siguron që snapshot-i të jetë plotësisht i konsistent me aplikacionin.

Për Linux (PostgreSQL / MySQL):
Linux nuk ka një ekuivalent vendas të VSS. Për të arritur konsistencën e aplikacionit, duhet të përdorni skriptet “pre-freeze” dhe “post-thaw” në lidhje me mjetet e të ftuarit të hipervizorit (p.sh., VMware Tools).

Këtu është një shembull i një pre-freeze-script të VMware për PostgreSQL 15+ që përgatit në mënyrë të sigurt bazën e të dhënave për një snapshot:

#!/bin/bash
# /usr/sbin/pre-freeze-script
# Sigurohuni që ky skript të jetë i ekzekutueshëm (chmod +x)

# 1. Udhëzoni PostgreSQL të përgatitet për një kopje rezervë
su - postgres -c "psql -c "SELECT pg_backup_start('vm_snapshot', true);""

# 2. Pastroni buffer-at e sistemit të skedarëve në disk
sync

# 3. Ngrijeni sistemin e skedarëve (duke supozuar se të dhënat janë në /var/lib/pgsql)
fsfreeze -f /var/lib/pgsql

Dhe post-thaw-script përkatës për të rifilluar operacionet:

#!/bin/bash
# /usr/sbin/post-thaw-script

# 1. Shkrijeni sistemin e skedarëve
fsfreeze -u /var/lib/pgsql

# 2. Udhëzoni PostgreSQL se kopja rezervë ka përfunduar
su - postgres -c "psql -c "SELECT pg_backup_stop();""

2. Përdorni Mjetet Native të Kopjimit Rezervë të Bazës së të Dhënave

Ndërsa snapshot-et e konsistente me aplikacionin janë më të mira se snapshot-et standarde, ato ende mbartin rrezikun e “VM stun”. Qasja më e sigurt për kopjet rezervë të bazës së të dhënave është përdorimi i mjeteve native të kopjimit rezervë që funksionojnë në mënyrë të pavarur nga hipervizori.

PostgreSQL (pg_basebackup):

pg_basebackup -h localhost -U replication_user -D /mnt/backups/pg_backup -Ft -z -P

MySQL/MariaDB (Percona XtraBackup / Mariabackup):
Këto mjete bëjnë kopje rezervë “hot”, pa bllokim, duke kopjuar skedarët e të dhënave dhe duke gjurmuar njëkohësisht ndryshimet në redo log.

mariabackup --backup --target-dir=/mnt/backups/mysql_backup --user=root --password=SecurePass

SQL Server (T-SQL):

BACKUP DATABASE [ProductionDB] 
TO DISK = N'Z:BackupsProductionDB.bak' 
WITH NOFORMAT, NOINIT, NAME = N'ProductionDB-Full Backup', 
SKIP, NOREWIND, NOUNLOAD, COMPRESSION, STATS = 10;
GO

3. Zbatoni Rikuperimin në një Pikë në Kohë (PITR) përmes Arkivimit të Log-eve

Një snapshot ditor ose një kopje rezervë e plotë ju mbron vetëm deri në minutën kur është marrë. Nëse baza juaj e të dhënave përplaset në orën 16:00 dhe snapshot-i juaj i fundit ishte në orën 02:00, ju humbisni 14 orë të dhëna transaksionale.

Për të arritur elasticitet të vërtetë të ndërmarrjes, duhet të kombinoni kopjet rezervë të plota të konsistente me aplikacionin me arkivimin e vazhdueshëm të log-eve (kopjimi rezervë i WAL, Redo Logs ose Transaction Logs çdo pak minuta). Kjo u lejon administratorëve të bazave të të dhënave (DBA) të rikthejnë bazën e të dhënave në një minutë specifike ose edhe në një ID specifike transaksioni përpara një katastrofe.

Strategjitë e Kopjimit Rezervë të Ndërmarrjes me CloudSave

Menaxhimi i skripteve të personalizuara “pre-freeze”, cron jobs për “dumps” native dhe dërgimi i log-eve në dhjetëra serverë të bazave të të dhënave është një makth operacional për ekipet DevOps. Këtu bëhet kritike një platformë e nivelit të ndërmarrjes si CloudSave.

CloudSave kapërcen hendekun midis virtualizimit dhe arkitekturës së bazës së të dhënave. Në vend që të mbështetet te snapshot-et e verbëra të hipervizorit, CloudSave përdor agjentë që njohin aplikacionin dhe që integrohen në mënyrë native me SQL Server, PostgreSQL, MySQL dhe Oracle.

Kur CloudSave fillon një kopje rezervë:
1. Ai komunikon drejtpërdrejt me motorin e bazës së të dhënave përmes API-ve native (si VSS për Windows ose transmetimi native WAL për Linux).
2. Ai orkestron pastrimin e buffer-ave të memories në disk pa shkaktuar “VM stuns” shkatërruese.
3. Ai kap në mënyrë të sigurt skedarët e të dhënave dhe menaxhon automatikisht shkurtimin e log-eve të transaksioneve.
4. Ai bën kopje rezervë të vazhdueshme të log-eve të transaksioneve, duke mundësuar Rikuperimin granular në një Pikë në Kohë (PITR) me pak klikime.

Duke shkarkuar kompleksitetin e konsistencës së aplikacionit te CloudSave, DBA-të dhe administratorët e sistemeve mund të garantojnë integritetin e të dhënave pa sakrifikuar performancën ose disponueshmërinë e klusterëve të tyre të prodhimit.

Përfundim

Snapshot-et e makinerive virtuale janë një mjet i jashtëzakonshëm për menaxhimin e infrastrukturës, por ato janë thelbësisht të papajtueshme me kërkesat ACID të bazave të të dhënave transaksionale. Mbështetja te snapshot-et e hipervizorit “crash-consistent” e ekspozon organizatën tuaj ndaj faqeve të dëmtuara, zinxhirëve të thyer të replikimit dhe humbjes katastrofike të të dhënave.

Për të mbrojtur të dhënat tuaja kritike, duhet të zbatoni “application-aware quiescing”, të përdorni metodologji native të kopjimit rezervë të bazës së të dhënave dhe të mbani arkiva të vazhdueshme të log-eve të transaksioneve. Duke adoptuar zgjidhje të dedikuara për kopje rezervë të ndërmarrjes, mund të siguroheni që bazat tuaja të të dhënave të mbeten shumë të disponueshme, plotësisht të rikuperueshme dhe plotësisht të sigurta.

Pse snapshot-et e VM-ve nuk janë të sigurta për bazat e të dhënave transaksionale: Një udhëzues i DBA-së për integritetin e të dhënave