Πρόσφατα κλήθηκα να διορθώσω μια corrupted database με αρκετά μεγάλο αριθμό corrupted pages. Η διαδικασία επιδιόρθωσης ήταν επίπονη και πήρε αρκετές ημέρες αλλά τελικά ολοκληρώθηκε.
Με την ολοκλήρωση της διαδικασίας ζήτησα να γίνει full backup καθώς τα ήδη υπάρχοντα backups ήταν και αυτά corrupted καθώς περιείχαν τις corrupted pages.
Κατά την διάρκεια του full backup όμως εμφανίστηκε ένα νέο μήνυμα λάθους που έλεγε το εξής:
Error: 5901, Severity: 16, State: 1
One or more recovery units belonging to database ‘ΧΧΧΧ’ failed to generate a checkpoint. This is typically caused by lack of system resources such as disk or memory, or in some cases due to database corruption. Examine previous entries in the error log for more detailed information on this failure.
The log scan number (ΧΧΧΧΧ:ΧΧΧ:Χ) passed to log scan in database ‘ ΧΧΧΧ ‘ is not valid. This error may indicate data corruption or that the log file (.ldf) does not match the data file (.mdf). If this error occurred during replication, re-create the publication. Otherwise, restore from backup if the problem results in a failure during startup.
Πραγματικά το λάθος αυτό δεν ήταν κάτι που περίμενα να δω μπροστά μου αλλά θυμήθηκα μια περίπτωση που το είχα ξαναδεί σε διαφορετική όμως περίπτωση και δεν μου φάνηκε λογικό αλλά το μύνημα ήταν ξεκάθαρο καθώς αναφέρει και database corruption.
Αρχικά έκανα ένα έλεγχο στο transaction log και αυτό δεν έδειξε κάποιο πρόβλημα.
Στην συνέχεια έκανα manual execution της διαδικασίας CHECKPOINT όπου έβγαζε το λάθος αυτό.
Η επόμενη κίνηση ήταν να δω το log_reuse_wait_desc field στην συγκεκριμένη database κάνοντας χρήση ενός SELECT * FROM sys.databases.
Το αποτέλεσμα που επέστεψε το συγκεκριμένο field ήταν "REPLICATION" αλλά η βάση δεν συμμετείχε σε κάποιο replication. Εντυπωσιακό. Πρέπει να πω ότι στο παρελθόν στην συγκεκριμένη database είχαν γίνει κάποιες προσπάθειες για mirroring αλλά και πάλι δεν υπήρχε ούτε αυτό.
Αφού έψαξα αναλυτικά ώστε να επιβεβαιώσω τις σκέψεις μου αποφάσισα να εκτελέσω την sp_removedbreplication καθώς κάπου υπήρχε "σκαλωμένο" κάποιο flag που όμως δεν εμφανίζονταν πουθενά.
SQL Script
EXEC sp_removedbreplication N‘ΧΧΧΧ’
Το αποτέλεσμα μετά την εκτέλεση ήταν να "ξεσκαλώσει" η διαδικασία του checkpoint και να μπορεί να γίνει το backup.
//Antonios Chatzipavlis