日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學(xué)無先后,達(dá)者為師

網(wǎng)站首頁 編程語言 正文

Redis之SDS數(shù)據(jù)結(jié)構(gòu)的使用_Redis

作者:四問四不知 ? 更新時間: 2022-10-03 編程語言

序言

Redis的幾種基本數(shù)據(jù)結(jié)構(gòu)有字符串(String)、哈希(Hash)、列表(List)、集合(Set)、有序集合(Sorted Set),這些是最常見的,也能在官網(wǎng)上查看到。

官網(wǎng)鏈接:Redis 教程_redis教程

字符串

前面也提到過字符串是設(shè)計了簡單動態(tài)字符串SDS(Simple Dynamic String)結(jié)構(gòu)來表示字符串。這種數(shù)據(jù)結(jié)構(gòu)可以提升字符串的操作效率,并可以保存二進(jìn)制數(shù)據(jù)。

先思考一個問題:

Redis是用C語言實(shí)現(xiàn)的,那么為什么沒有復(fù)用C語言的字符串實(shí)現(xiàn)方法,而選用了SDS呢?

char*字符串?dāng)?shù)組

C語言實(shí)現(xiàn)字符串使用的是char*字符串?dāng)?shù)組,它是一塊連續(xù)的內(nèi)存空間,一次存放了字符串的每一個字符,并且最后一個字符是“\0”,用來標(biāo)識字符串的結(jié)尾位置,如下圖,

連續(xù)的內(nèi)存空間的所有字符串沒有分隔符計算機(jī)就沒辦法區(qū)分字符串與字符串之間的位置。在C語言標(biāo)準(zhǔn)庫中字符串的操作函數(shù)就會通過檢查字符串?dāng)?shù)組中是否有“\0”來判斷字符串是否結(jié)束。例如字符串操作函數(shù)strlen函數(shù),它就是在遍歷字符串?dāng)?shù)組中的每一個字符,并進(jìn)行計數(shù),直到檢查到“\0”,它的時間復(fù)雜度是O(n)。流程如下,

簡單動態(tài)字符串SDS

SDS的數(shù)據(jù)結(jié)構(gòu)里包含:字符串實(shí)際長度,字符串分配空間長度,SDS類型,字符數(shù)組,其中字符數(shù)組buf[]用來保存實(shí)際數(shù)據(jù),如下圖,

再來看看類似的字符操作函數(shù)sdslen函數(shù)的源碼(在sds.h文件中),直接根據(jù)SDS類型返回對應(yīng)的字符串現(xiàn)有長度,避免了對字符串的遍歷,時間復(fù)雜度變成了O(1),當(dāng)然也會付出一點(diǎn)代價增加了空間復(fù)雜度。這都是設(shè)計人員讓數(shù)據(jù)操作更加高效。源碼如下,

static inline size_t sdslen(const sds s) {
    unsigned char flags = s[-1];
    switch(flags&SDS_TYPE_MASK) {
        case SDS_TYPE_5:
            return SDS_TYPE_5_LEN(flags);
        case SDS_TYPE_8:
            return SDS_HDR(8,s)->len;
        case SDS_TYPE_16:
            return SDS_HDR(16,s)->len;
        case SDS_TYPE_32:
            return SDS_HDR(32,s)->len;
        case SDS_TYPE_64:
            return SDS_HDR(64,s)->len;
    }
    return 0;
}

再來看一下字符串的拷貝源碼,操作都使用了字符串的現(xiàn)有長度,拷貝后進(jìn)行更新。

sds sdscpylen(sds s, const char *t, size_t len) {
    // 判斷字符串?dāng)?shù)組分配的空間長度是不是小于字符串?dāng)?shù)組當(dāng)前長度
    if (sdsalloc(s) < len) {
        // 根據(jù)要追加的長度len-sdslen(s)和現(xiàn)有長度,判斷是否增加新的空間
        s = sdsMakeRoomFor(s,len-sdslen(s));
        if (s == NULL) return NULL;
    }
    // 將源字符串t中l(wèi)en長度的數(shù)據(jù)拷貝到目標(biāo)字符串結(jié)尾
    memcpy(s, t, len);
    // 拷貝完后,在目標(biāo)字符串結(jié)尾加上\0
    s[len] = '\0';
    // 設(shè)置字符串?dāng)?shù)組最新當(dāng)前長度
    sdssetlen(s, len);
    return s;
}

SDS把目標(biāo)字符串的空間檢查和擴(kuò)容封裝在了sdsMakeRoomFor函數(shù)中,追加、打印、復(fù)制等操作都會調(diào)用該函數(shù)。可以看到該函數(shù)根據(jù)sds的信息進(jìn)行動態(tài)擴(kuò)容,源碼如下,

sds sdsMakeRoomFor(sds s, size_t addlen) {
    void *sh, *newsh;
    // 獲取sds可用空間
    size_t avail = sdsavail(s);
    size_t len, newlen;
    char type, oldtype = s[-1] & SDS_TYPE_MASK;
    int hdrlen;
 
    // 如果可用空間大于等于要增加的空間,則直接返回
    if (avail >= addlen) return s;
    // sds長度
    len = sdslen(s);
    // sds指針
    sh = (char*)s-sdsHdrSize(oldtype);
    // 新字符串長度
    newlen = (len+addlen);
    // 如果新長度小于最大預(yù)分配長度,則進(jìn)行兩倍擴(kuò)容
    if (newlen < SDS_MAX_PREALLOC)
        newlen *= 2;
    else
        newlen += SDS_MAX_PREALLOC;
    type = sdsReqType(newlen);
    // SDS類型5轉(zhuǎn)換為類型8
    if (type == SDS_TYPE_5) type = SDS_TYPE_8;
 
    hdrlen = sdsHdrSize(type);
    if (oldtype==type) {
        newsh = s_realloc(sh, hdrlen+newlen+1);
        if (newsh == NULL) return NULL;
        s = (char*)newsh+hdrlen;
    } else {
        /* Since the header size changes, need to move the string forward,
         * and can't use realloc */
        newsh = s_malloc(hdrlen+newlen+1);
        if (newsh == NULL) return NULL;
        memcpy((char*)newsh+hdrlen, s, len+1);
        s_free(sh);
        s = (char*)newsh+hdrlen;
        s[-1] = type;
        sdssetlen(s, len);
    }
    sdssetalloc(s, newlen);
    return s;
}

?可以看到sdsMakeRoomFor函數(shù)中sdshdr5類型不再使用直接轉(zhuǎn)換成了sdshdr8類型,它們是SDS設(shè)計的5種類型,分別表示sdshdr5sdshdr8sdshdr16sdshdr32sdshdr64,下面就看一下這幾種類型的結(jié)構(gòu)源碼,如下圖,

struct __attribute__ ((__packed__)) sdshdr5 {
    unsigned char flags; /* 3 lsb of type, and 5 msb of string length */
    char buf[];
};
struct __attribute__ ((__packed__)) sdshdr8 {
    uint8_t len; /* used */
    uint8_t alloc; /* excluding the header and null terminator */
    unsigned char flags; /* 3 lsb of type, 5 unused bits */
    char buf[];
};
struct __attribute__ ((__packed__)) sdshdr16 {
    uint16_t len; /* used */
    uint16_t alloc; /* excluding the header and null terminator */
    unsigned char flags; /* 3 lsb of type, 5 unused bits */
    char buf[];
};
struct __attribute__ ((__packed__)) sdshdr32 {
    uint32_t len; /* used */
    uint32_t alloc; /* excluding the header and null terminator */
    unsigned char flags; /* 3 lsb of type, 5 unused bits */
    char buf[];
};
struct __attribute__ ((__packed__)) sdshdr64 {
    uint64_t len; /* used */
    uint64_t alloc; /* excluding the header and null terminator */
    unsigned char flags; /* 3 lsb of type, 5 unused bits */
    char buf[];
};

sdshdr5已不再使用,所以在函數(shù)中做了處理,把sdshdr5類型轉(zhuǎn)換為sdshdr8類型。前面也提到過SDS是緊湊型字符串?dāng)?shù)據(jù)結(jié)構(gòu),以sdshdr8為例,它是用的是uint8_t即8位無符號整型,會占用1字節(jié)的內(nèi)存空間。SDS之所以設(shè)計不同的結(jié)構(gòu)是為了能靈活保存不同大小的字符串,從而有效節(jié)省內(nèi)存空間。

另外,__attribute__ ((__packed__))標(biāo)志可以告訴編譯器在編譯以上數(shù)據(jù)結(jié)構(gòu)時,不實(shí)用字節(jié)對齊的方式(不滿8字節(jié)的整數(shù)倍,則會自動補(bǔ)齊),而是采用緊湊的方式分配內(nèi)存。

原文鏈接:https://blog.csdn.net/zkkzpp258/article/details/126193448

欄目分類
最近更新