What you need to know when using MERGE statement

Antonios Chatzipavlis
Monday 13 January 2020

Στο SQL Server 2008 παρουσιάστηκε για πρώτη φορά το MERGE statement το οποίο απλοποιούσε τις διαδικασίες insert/update/delete ιδιαίτερα σε ETL διαδικασίες και από όσο έχω δει έχει αγαπηθεί από αρκετούς και μέσα σε αυτούς είμαι και εγώ.

Όμως πρέπει να γνωρίζουμε κάποια πράγματα που αφορούν την συμπεριφορά του καθώς έχει και αυτό τις ιδιαιτερότητες του τις οποίες θα σας παρουσιάσω στο άρθρο αυτό.

Αρχικά να τονίσω ότι είναι atomic statement αυτό σημαίνει ότι ή θα γίνουν όλα ή τίποτα όμως έχει ιδιαιτερότητες όσον αφορά το concurrency που προσφέρει καθώς μπορεί εύκολα να έχουμε καταστάσεις που ονομάζονται race conditions.

Αρχικά με το step-1 του παρακάτω script ας δημιουργήσουμε μια sample database και κάποιους πίνακες με την λογική ότι ο S είναι αυτός που θα έχεις τις εγγραφές που θέλουμε να ενημερώσουν τον T.

Το πρώτο πράγμα που πρέπει να καταλάβουμε είναι ότι αν η ίδια εντολή εκτελεστεί από δύο διαφορετικά sessions ταυτόχρονα θα έχουμε race conditions ή primary key conflicts. Αν για παράδειγμα εκτελέσουμε το step-2a σύντομα θα έχουμε primary key violations και αν δεν έχουμε βάλει error handler τότε ….

Για να διασφαλίσουμε τέτοιες περιπτώσεις θα πρέπει να χρησιμοποιούμε ισχυρότερο isolation level όπως SERIALIZABLE ή το HOLDLOCK table hind όπως στο step-2b.

Στο step-4 ας βάλουμε κάποιες εγγραφές στο πίνακα S, και ας εκτελέσουμε την MERGE για να ενημερώσουμε τον Τ όπου φυσικά όλα θα κυλήσουν ομαλά.

Αν στο πίνακα S βάλουμε ακόμα μια φορά τα ίδια δεδομένα χωρίς να έχουμε σβήσει τα προηγούμενα (step-5) θα πάρουμε το εξής λάθος

Msg 8672, Level 16, State 1, Line 79
The MERGE statement attempted to UPDATE or DELETE the same row more than once. This happens when a target row matches more than one source row. A MERGE statement cannot UPDATE/DELETE the same row of the target table multiple times. Refine the ON clause to ensure a target row matches at most one source row, or use the GROUP BY clause to group the source rows.

Αν τώρα (step-6) ο πίνακας S έχει διπλές εγγραφές και εκτελέσουμε την merge τότε θα πάρουμε το λάθος

Msg 2627, Level 14, State 1, Line 96
Violation of PRIMARY KEY constraint 'PK__t__357D0D3EB1FFFDF3'. Cannot insert duplicate key in object 'dbo.t'. The duplicate key value is (1).

Να επισημανθεί ότι στις δύο τελευταίες περιπτώσεις χρησιμοποιείται holdlock table hint. Αλλά ο S περιέχει διπλές εγγραφές για αυτό είναι σκόπιμο να γίνεται group by ή distinct.

Αυτές είναι κάποιες περιπτώσεις που πρέπει κάποιος να γνωρίζει όταν χρησιμοποιεί την MERGE.

-- step 1

create database mergedemo;

use mergedemo;

create table s (col1 int, col2 nchar(10));
create table t (col1 int primary key, col2 nchar(10));

-- step 2a

set nocount on;
while 1=1
            @col1 int = checksum(sysdatetime()),
            @col2 nchar(10) = N'sqlschool'; 

    merge into t
    using ( values( @col1, @col2) ) as s ( col1, col2 )
        on t.col1 = s.col1
    when matched then update
        set t.col2 = s.col2
    when not matched then insert
        values( s.col1,s.col2 );
set nocount off;

-- step 2b

set nocount on;
while 1=1
            @col1 int = checksum(sysdatetime()),
            @col2 nchar(10) = N'sqlschool'; 

    merge into t with(holdlock)
    using ( values( @col1, @col2) ) as s ( col1, col2 )
        on t.col1 = s.col1
    when matched then update
        set t.col2 = s.col2
    when not matched then insert
        values( s.col1,s.col2 );
set nocount off;

-- step 4

truncate table s;
truncate table t;

insert into S values (1,'a'),(2,'b'),(3,'c');
select * from S;

merge into t with(holdlock)
    using s on t.col1 = s.col1
    when matched then update
        set t.col2 = s.col2
    when not matched then insert
        values( s.col1,s.col2 );

select * from t;

-- step 5

insert into S values (1,'a'),(2,'b'),(3,'c');
select * from S;

merge into t with(holdlock)
    using s on t.col1 = s.col1
    when matched then update
        set t.col2 = s.col2
    when not matched then insert
        values( s.col1,s.col2 );

select * from t;

-- step 6

truncate table s;
truncate table t;

insert into S values (1,'a'),(2,'b'),(3,'c'),(1,'d');
select * from S;

merge into t with(holdlock)
    using s on t.col1 = s.col1
    when matched then update
        set t.col2 = s.col2
    when not matched then insert
        values( s.col1,s.col2 );

select * from t;

Antonios is a Data Solutions Consultant and Trainer. He has been working in IT since 1988. In his career, he has worked as senior developer, IT Manager, Solutions Architect and IT Consultant. Since 1995 he has been devoted on new technologies and software development tools, mainly by Microsoft, either by training company staff and colleagues or assisting them in design, development and implementation as a consultant or chief developer. He has focused in Databases and Data Science since 1995. He specialized in Microsoft SQL Server since version 6.0 in areas like SQL Server Internals, Database Design and Development, Business Intelligence and in 2010 he has started working with Azure Data Platform, NoSQL databases, Big Data Technologies and Machine Learning. He is an active member of many IT communities in Greece, answering colleagues' questions and writing articles in his web site. He is the owner of SQLschool.gr which is a community portal with a lot of information about Microsoft SQL Server. He has been a Microsoft Certified Trainer (MCT) since 2000. Microsoft honored him as MVP on Data Platform due to his activities in SQL Server since 2010. He holds a large number of Microsoft Certifications and Microsoft SQL Server Certifications since version 6.5.


