Twitter的雪花算法SnowFlake原版及改进版全解析

2022-08-22 13:27:49

Twitter的雪花算法SnowFlake原版及改进版全解析

Twitter的雪花算法SnowFlake原版

packagecom.wheel.eden.common.util.core;/**
 * Twitter 的 Snowflake 算法
 * 分布式系统中, 有一些需要使用全局唯一ID的场景, 有些时候我们希望能使用一种简单一些的ID,并且希望ID能够按照时间有序生成。
 * <p>
 * snowflake 的结构如下(每部分用-分开):
 * 符号位(1bit)- 时间戳相对值(41bit)- 数据中心标志(5bit)- 机器标志(5bit)- 递增序号(12bit)
 * 0 - 0000000000 0000000000 0000000000 0000000000 0 - 00000 - 00000 - 000000000000
 * <p>
 * 1位标识, 由于long基本类型在Java中是带符号的, 最高位是符号位, 正数是0, 负数是1,id一般是正数,所以最高位是0
 * 41位毫秒级时间截, 存储时间截的差值(当前时间截 - 开始时间截) ,可以使用69年 (年T = (1L << 41) / (1000L * 60 * 60 * 24 * 365) = 69)
 * 10位数据机器位, 可以部署在1024个节点, 包括5位dataCenterId和5位workerId
 * 12位序列, 毫秒内的计数, 支持每个节点每毫秒产生4096个ID序号
 * <p>
 * SnowFlake 共计64位分布式ID, 正好是一个Long型, 且可根据ID反推出 createTime , dataCenterId , workerId 等信息
 * SnowFlake 整体上按照时间自增排序, 分布式系统内不会产生ID碰撞(由数据中心ID和机器ID作区分), 每秒能够产生26万ID左右
 * <p>
 * 雪花算法改进版, 参考:
 * https://blog.csdn.net/u010541670/article/details/119775492
 * 自动生成数据中心ID和机器ID算法, 参考:
 * https://blog.csdn.net/u010541670/article/details/119774545
 * 
 * @author 白纸涂鸦
 * @date 2021/7/28
 * @since 1.0.0
 */publicclassTwitterSnowflake{// ================================ Default ============================================/** 基准开始时间截 (2021-01-01) 一旦确定不能变动 */privatefinalstaticlong EPOCH=1609430400000L;/** 0L **/privatefinalstaticlong MIN_POSITIVE_LONG=0L;/**
     * 每一部分占用的位数
     */privatefinalstaticlong CENTER_ID_BITS=5L;privatefinalstaticlong WORKER_ID_BITS=5L;privatefinalstaticlong SEQUENCE_BITS=12L;/**
     * 每一部分的最大值
     */privatefinalstaticlong MAX_WORKER_ID=~(-1L<< WORKER_ID_BITS);privatefinalstaticlong MAX_CENTER_ID=~(-1L<< CENTER_ID_BITS);privatefinalstaticlong MAX_SEQUENCE=~(-1L<< SEQUENCE_BITS);/** 序列ID的掩码, 2^12 -1 = 4095 */privatefinalstaticlong SEQUENCE_MASK=~(-1L<< SEQUENCE_BITS);/** 机器ID向左移12位 **/privatefinalstaticlong WORKER_ID_SHIFT= SEQUENCE_BITS;/** 数据中心ID向左移17位(12+5) **/privatefinalstaticlong CENTER_ID_SHIFT= SEQUENCE_BITS+ WORKER_ID_BITS;/** 时间截向左移22位(5+5+12) **/privatefinalstaticlong TIMESTAMP_LEFT_SHIFT= SEQUENCE_BITS+ WORKER_ID_BITS+ CENTER_ID_BITS;// ================================ Fields ==============================================/** 数据中心ID (0~31) **/privatefinallong centerId;/** 机器ID (0~31) **/privatefinallong workerId;/** 序列ID (0~4095) **/privatelong sequence=0L;/** 上次生成ID的时间截 **/privatelong lastTimestamp=-1L;// ================================ Constructors ========================================publicTwitterSnowflake(long workerId,long centerId){if(workerId<= MAX_WORKER_ID&& workerId>= MIN_POSITIVE_LONG){if(centerId<= MAX_CENTER_ID&& centerId>= MIN_POSITIVE_LONG){this.workerId= workerId;this.centerId= centerId;}else{thrownewIllegalArgumentException(StrUtil.format("dataCenter Id can't be greater than {} or less than 0", MAX_CENTER_ID));}}else{thrownewIllegalArgumentException(StrUtil.format("worker Id can't be greater than {} or less than 0", MAX_WORKER_ID));}}// ================================ Methods ============================================/**
     * 获得下一个分布式ID (该方法是线程安全的)
     *
     * @return snowflakeId
     */publicsynchronizedlongnextId(){// 当前时间戳long timestamp=genTime();// 如果当前时间戳小于上一次ID生成的时间戳,说明系统时钟回退过这个时候应当抛出异常if(timestamp< lastTimestamp){thrownewIllegalStateException(StrUtil.format("Clock moved backwards. Refusing to generate id for {}ms",this.lastTimestamp- timestamp));}// 同一毫秒内进行序列自增if(timestamp== lastTimestamp){
            sequence=(sequence+1L)& SEQUENCE_MASK;// 同一毫秒的序列数已经达到最大if(sequence==0L){
                timestamp=tilNextMillis(lastTimestamp);}}else{// 不同毫秒内,序列号置为0
            sequence=0L;}// 重置最后生成ID的时间戳
        lastTimestamp= timestamp;// 时间戳部分 | 数据中心部分 | 机器标识部分 | 序列号部分return(timestamp- EPOCH)<< TIMESTAMP_LEFT_SHIFT| centerId<< CENTER_ID_SHIFT| workerId<< WORKER_ID_SHIFT|this.sequence;}/**
     * 阻塞到下一个毫秒,直到获得新的时间戳
     *
     * @param lastTimestamp 上次生成ID的时间截
     * @return 当前时间戳
     */privatelongtilNextMillis(long lastTimestamp){long timestamp=genTime();while(timestamp<= lastTimestamp){
            timestamp=genTime();}return timestamp;}/**
     * 返回当前毫秒时间戳
     *
     * @return 当前毫秒时间戳
     */privatelonggenTime(){returnSystem.currentTimeMillis();}}

Twitter的雪花算法SnowFlake改进版

1、闰秒兼容改进
https://blog.csdn.net/u010541670/article/details/119774545

2、时钟回拨兼容改进
https://blog.csdn.net/wengengeng/article/details/106007879

3、位数改进
https://blog.csdn.net/ciap37959/article/details/100619920

4、自动获取 datacenterId 和 workerId 改进
https://blog.csdn.net/u010541670/article/details/119774545

  • 作者:微凉不是青风
  • 原文链接:https://blog.csdn.net/u010541670/article/details/119775492
    更新时间:2022-08-22 13:27:49