]> git.evergreen-ils.org Git - OpenSRF.git/commit
LP#1494486: Limit damage caused by dropped drone XMPP sockets
authorMike Rylander <mrylander@gmail.com>
Thu, 10 Sep 2015 20:56:13 +0000 (16:56 -0400)
committerGalen Charlton <gmc@esilibrary.com>
Thu, 4 Feb 2016 16:22:59 +0000 (11:22 -0500)
commit55807240854d0d532a5f70f1f483ed8086eb9d95
treedead6c1b34fed45783b3c5b01ed71d02ba39ff70
parent33a5e60ee8f4c539d5bf3dc1d1ff1b62d5715d65
LP#1494486: Limit damage caused by dropped drone XMPP sockets

It is apparently possible for drones to get into a state where their XMPP
socket is closed but they don't notice. This is bad because the drone can
continue to receive requests from its listener but can no longer respond
to them. To limit the pain this can cause, we should kill the drone as soon
as we notice this condition.

To avoid overhead, this commit notices when the socket returns an error (or
raises a signal, in Perl) upon write, and exits immediately.  One message
will be lost, but the drone will no longer be a black hole that does nothing
but absorb requests it can never fill.

To test
-------
[1] Start an OpenSRF stack and look for a drone process.
[2] Use lsof to identify which socket that drone is using
    to talk to XMPP.
[3] Use gdb to attach to the process and close the socket, e.g.,

    $ gdb -p $PID
    (gdb) p close(11) # or whatever the socket number was
    (gdb) c

[4] Use srfsh to make requests of that service. Eventually, one
    of them will hit the drone.
[5] Sans patch, the request will get handled by the drone, but
    the results will never get sent, and the drone will remain
    available to handle other requests.
[6] With the patch, the drone will exit when it discovers that it
    can no longer write to the XMPP socket.

Signed-off-by: Mike Rylander <mrylander@gmail.com>
Signed-off-by: Galen Charlton <gmc@esilibrary.com>
src/libopensrf/osrf_app_session.c
src/perl/lib/OpenSRF/Transport/SlimJabber/XMPPReader.pm