session.merge already does non-deterministic reconciliation for persistent objects, add this to pending

This bug was discussed on stack overview here:

http://stackoverflow.com/questions/33888539/getting-sqlalchemy-to-do-on-duplicate-key-update-inside-an-orm-cascade-in-mys?noredirect=1#comment55890922_33888539

We create a simple object hierarchy: Groups contain Users and Users have Email addresses. We want the email address to be stored uniquely even if its shared between users. Constructing two users with the same address and using session.merge() to add them has the correct behaviour (the same key is reused and no error is thrown). If, on the other hand, we add the two users to a group and then use session.merge() on the group instead them the two identical addresses lead to a unique key exception on address (due to an insert many).

Here is the relevant code:

from sqlalchemy import create_engine, Column, types
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy.orm import sessionmaker, scoped_session
from sqlalchemy.orm import Session

from sqlalchemy import ForeignKey
from sqlalchemy.orm import relationship, backref


engine = create_engine('sqlite:///:memory:', echo=False)
Base = declarative_base()

session = scoped_session(sessionmaker(bind=engine))

class Group(Base):
    __tablename__ = "groups"
    gid = Column(types.Integer, primary_key=True)
    name = Column(types.String(255))

    users = relationship("User", backref="group")

    def __repr__(self):
        ret =  "Group(name=%r)" % self.name
        for user in self.users:
            ret += str(user)

class User(Base):
    __tablename__ = "users"
    login = Column(types.String(50), primary_key=True)
    name = Column(types.String(255))
    group_id = Column(types.Integer, ForeignKey('groups.gid'))
    address = Column(types.String(200), 
                            ForeignKey('addresses.email_address'))
    email = relationship("Address")

    def __repr__(self):
        return "User(login=%r, name=%r)\n%s" % (self.login, self.name,
                str(self.email))


class Address(Base):
    __tablename__ = 'addresses'
    email_address = Column(types.String(200), nullable=False, primary_key=True)
    #user_login = Column(types.String(50), ForeignKey('users.login'))

    def __repr__(self):
        return "<Address(email_address='%s')>" % self.email_address


Base.metadata.create_all(engine)

if __name__ == '__main__':

    # this works correctly even though we reuse a unique key
    u1 = User(login='Guy', name="Some Guy")
    u1.email=Address(email_address='nameless@yahoo.com')
    u2 = User(login='Gal', name="Some Gal")
    u2.email=Address(email_address='nameless@yahoo.com')
    session.merge(u1) 
    session.merge(u2) 
    session.commit()

    print("two users with addresses")
    for u in session.query(User):
        print(u)


    # though this is similar it ends up using insertmany and throws a unique key
    # constraint even with the merge
    u3 = User(login='Mr. User', name="A dude")
    u3.email=Address(email_address='james@yahoo.com')
    u4 = User(login='Mrs. User', name="A dudette")
    u4.email=Address(email_address='jill@yahoo.com')
    u5 = User(login='Mrs. User2', name="A dudette2")
    u5.email=Address(email_address='jill@yahoo.com')
    g1 = Group(name="G1")
    g1.users.append(u3)
    g1.users.append(u4)
    g1.users.append(u5)
    session.merge(g1) 
    session.commit()

    print(g1)

Comments (8)