Здравствуйте, Pzz, Вы писали:
Pzz>Пусть она сама скажет, что сдвинулась.
Так проблема не в том, сдвинулась/не сдвинулась, а почему и что с этим делать. Плохое сообщение в кафке? Что-то не то из базы взяли, сигналинг по управляющему протоколу?
Ну и там "почему" был кривой код, внешнее событие только тригернуло его. И если бы этот плохой код (неверный ассёршн) не валил программу, то всё бы и работало, причём правильно.
В нашем случае мы решили, что безопаснее в будущем на проде нарушение утверждений документировать, но не валить программу. Поверь, тому предшествовало обсуждение, что для нас лучше.
_>>Автоматический откат не всегда поможет, т.к. это же комбинация версии и входных данных. Вохможно, этот ассёрт был воткнут 10 версий назад, просто в эту ветку не заходило.
Pzz>Ну, программа стала колом сразу после обновления. Совпадение возможно, но всё же не слишком вероятно.
Колом стала не сразу после обновления, а через какое-то значительное время. Врать не буду что именно так и было, но вполне возможно, что версий накатили не одну.
Pzz>В любом случае, предыдущая версия считается условно рабочей. Хуже точно не станет.
Опсы так и поступают, у нас апгрейд планируется загодя, сначала на стейджинге у клиента. Потом на проде и агрессивно мониторится сутки-двое. Если что не так — откат.