MQ解决消息重发--做到幂等性

1、发送端MQ-client(消息生产者:Producer)将消息发送给MQ-server;



  2、MQ-server将消息落地;



  3、MQ-server回ACK给MQ-client(Producer);



  4、MQ-server将消息发送给消息接受端MQ-client(消息消费者:Customer);



  5、MQ-client(Customer)消费接受到消息后发送ACK给MQ-server;



  6、MQ-server将落地消息删除

二、消息重复发送原因



  为了保证消息必达,MQ使用了消息超时、重传、确认机制。使得消息可能被重复发送,如上图中,由于网络不可达原因:3和5中断,可能导致消息重发。消息生产者a收不到MQ-server的ACK,重复向MQ-server发送消息。MQ-server收不到消息消费者c的ACK,重复向消息消费者c发消息。



三、消息重复发送产生的后果



  举个例子:购买会员卡,上游支付系统负责给用户扣款,下游系统负责给用户发卡,通过MQ异步通知。不管是上半场的ACK丢失,导致MQ收到重复的消息,还是下半场ACK丢失,导致购卡系统收到重复的购卡通知,都可能出现,上游扣了一次钱,下游发了多张卡。



四、MQ内部如何做到幂等性的



  对于每条消息,MQ内部生成一个全局唯一、与业务无关的消息ID:inner-msg-id。当MQ-server接收到消息时,先根据inner-msg-id判断消息是否重复发送,再决定是否将消息落地到DB中。这样,有了这个inner-msg-id作为去重的依据就能保证一条消息只能一次落地到DB。



五、消息消费者应当如何做到幂等性



  1、对于非幂等性业务且要求实现幂等性业务:生成一个唯一ID标记每一条消息,将消息处理成功和去重日志通过事物的形式写入去重表。



  2、对于非幂等性业务可不实现幂等性的业务:权衡去重所花的代价决定是否需要实现幂等性,如:购物会员卡成功,向用户发送通知短信,发送一次或者多次影响不大。不做幂等性可以省掉写去重日志的操作。
  
  再次回顾消息总线核心架构,它由发送端、服务端、固化存储、接收端四大部分组成。



为保证消息的可达性,超时、重传、确认机制可能导致消息总线、或者业务方收到重复的消息,从而对业务产生影响。



举个栗子:



购买会员卡,上游支付系统负责给用户扣款,下游系统负责给用户发卡,通过MQ异步通知。不管是上半场的ACK丢失,导致MQ收到重复的消息,还是下半场ACK丢失,导致购卡系统收到重复的购卡通知,都可能出现,上游扣了一次钱,下游发了多张卡。



消息总线的幂等性设计至关重要,是本文将要讨论的重点。



二、上半场的幂等性设计



MQ消息发送上半场,即上图中的1-3



1,发送端MQ-client将消息发给服务端MQ-server



2,服务端MQ-server将消息落地



3,服务端MQ-server回ACK给发送端MQ-client



如果3丢失,发送端MQ-client超时后会重发消息,可能导致服务端MQ-server收到重复消息。



此时重发是MQ-client发起的,消息的处理是MQ-server,为了避免步骤2落地重复的消息,对每条消息,MQ系统内部必须生成一个inner-msg-id,作为去重和幂等的依据,这个内部消息ID的特性是:



(1)全局唯一



(2)MQ生成,具备业务无关性,对消息发送方和消息接收方屏蔽



有了这个inner-msg-id,就能保证上半场重发,也只有1条消息落到MQ-server的DB中,实现上半场幂等。



三、下半场的幂等性设计



MQ消息发送下半场,即上图中的4-6



4,服务端MQ-server将消息发给接收端MQ-client



5,接收端MQ-client回ACK给服务端



6,服务端MQ-server将落地消息删除



需要强调的是,接收端MQ-client回ACK给服务端MQ-server,是消息消费业务方的主动调用行为,不能由MQ-client自动发起,因为MQ系统不知道消费方什么时候真正消费成功。



如果5丢失,服务端MQ-server超时后会重发消息,可能导致MQ-client收到重复的消息。



此时重发是MQ-server发起的,消息的处理是消息消费业务方,消息重发势必导致业务方重复消费(上例中的一次付款,重复发卡),为了保证业务幂等性,业务消息体中,必须有一个biz-id,作为去重和幂等的依据,这个业务ID的特性是:



(1)对于同一个业务场景,全局唯一



(2)由业务消息发送方生成,业务相关,对MQ透明



(3)由业务消息消费方负责判重,以保证幂等



最常见的业务ID有:支付ID,订单ID,帖子ID等。



具体到支付购卡场景,发送方必须将支付ID放到消息体中,消费方必须对同一个支付ID进行判重,保证购卡的幂等。



有了这个业务ID,才能够保证下半场消息消费业务方即使收到重复消息,也只有1条消息被消费,保证了幂等。



三、总结



MQ为了保证消息必达,消息上下半场均可能发送重复消息,如何保证消息的幂等性呢?



上半场



MQ-client生成inner-msg-id,保证上半场幂等。



这个ID全局唯一,业务无关,由MQ保证。



下半场



业务发送方带入biz-id,业务接收方去重保证幂等。



这个ID对单业务唯一,业务相关,对MQ透明。



结论:幂等性,不仅对MQ有要求,对业务上下游也有要求


Category storage