Δεν θα σταματήσω να γράφω για την σημασία που έχουν τα statistics στην επιλογή του καλύτερου execution plan ποτέ. Αρκετά μεγάλος αριθμός καθυστερήσεων σε queries οφείλεται σε αυτά και προσωπικά κρίνω απαραίτητο να υπάρχει σε όλους η συγκεκριμένη γνώση γύρω από αυτά.
Στο παρελθόν έχω γράψει αρκετά άρθρα γύρω από αυτά και σήμερα επανέρχομαι με ακόμα ένα με το οποίο θέλω να ρίξω περισσότερο φως σε αυτά.
Από το SQL Server 2012 SP2 (αν και τα BOL λένε από το SQL Server 2008 αλλά δεν έχω πρόχειρο ένα τέτοιο instance για να το δοκιμάσω) υπάρχει ένα dynamic management view (DMV) το οποίο δίνει αρκετές πληροφορίες γύρω από την ενημέρωση των statistics και αυτό είναι το sys.dm_db_stats_properties
To documentation αυτού είναι αρκετά πλήρες αλλά θα ήθελα να επισημάνω για ακόμα μια φορά το πότε γίνονται update τα statistics.
Μέχρι τον SQL Server 2014 o default αλγόριθμος λέει ότι για να γίνει update statistics θα πρέπει στην πρώτη κολώνα που αναφέρεται στο definition των statistics να έχουν γίνει αλλαγές πάνω από το 20% + 500 rows. Βέβαια μην ξεχνάμε και το trace flag 2371 που αλλάζει τον αλγόριθμο αυτό με αρκετά μικρότερο threshold και που πλέον στον SQL Server 2016 είναι το default χωρίς να γίνεται χρήση του trace flag.
Με το παρακάτω query και με την χρήση της παραπάνω αναφερόμενης DMV μπορώ πραγματικά να δω σημαντικές πληροφορίες που αφορούν το πότε έχει γίνει τελευταία φορά update statistics το τι δείγμα εγγραφών έχει συμπεριληφθεί σε αυτά και το σημαντικό πόσες αλλαγές (insert/update/delete) έχουν γίνει από τότε.
Με την εκτέλεση του παρακάτω query σε τακτά χρονικά διαστήματα και αποθηκεύοντας τα δεδομένα της κάθε εκτέλεσης μπορώ εύκολα να καταλάβω πως ακριβώς ενημερώνεται η database και να ορίζω καλύτερα πολλές στρατηγικές γύρω από θέμα όπως update statistics, rebuild/reorg indexes και ακόμα να εντοπίζω καταστάσεις όπως είναι εργασίες που τρέχουν στο παρασκήνιο και κανείς δεν έχει πάρει χαμπάρι ότι τρέχουν.
select
OBJECT_NAME(s.[object_id]) as table_name
, p.stats_id as statistic_id
, s.[name] AS statistic_name
, p.last_updated
, p.[rows]
, p.rows_sampled
, p.unfiltered_rows
, p.modification_counter
from sys.stats as s
outer apply sys.dm_db_stats_properties (s.[object_id],s.stats_id) as p
where OBJECTPROPERTY(p.[object_id],'IsUserTable')=1
//antonch