Redis：緩存被我寫滿了，該怎么辦？

介紹

redis是一個內(nèi)存數(shù)據(jù)庫，當(dāng)Redis使用的內(nèi)存超過物理內(nèi)存的限制后，內(nèi)存數(shù)據(jù)會和磁盤產(chǎn)生頻繁的交換，交換會導(dǎo)致Redis性能急劇下降。所以在生產(chǎn)環(huán)境中我們通過配置參數(shù)maxmemoey來限制使用的內(nèi)存大小。

當(dāng)實(shí)際使用的內(nèi)存超過maxmemoey后，Redis提供了如下幾種可選策略。

noeviction：寫請求返回錯誤

volatile-lru：使用lru算法刪除設(shè)置了過期時間的鍵值對 volatile-lfu：使用lfu算法刪除設(shè)置了過期時間的鍵值對 volatile-random：在設(shè)置了過期時間的鍵值對中隨機(jī)進(jìn)行刪除 volatile-ttl：根據(jù)過期時間的先后進(jìn)行刪除，越早過期的越先被刪除

allkeys-lru：在所有鍵值對中，使用lru算法進(jìn)行刪除 allkeys-lfu：在所有鍵值對中，使用lfu算法進(jìn)行刪除 allkeys-random：所有鍵值對中隨機(jī)刪除

我們來詳細(xì)了解一下lru和lfu算法，這是2個常見的緩存淘汰算法。「因?yàn)橛嬎銠C(jī)緩存的容量是有限的，所以我們要刪除那些沒用的數(shù)據(jù)，而這兩種算法的區(qū)別就是判定沒用的緯度不一樣。」

LRU算法

「lru（Least recently used，最近最少使用）算法，即最近訪問的數(shù)據(jù)，后續(xù)很大概率還會被訪問到，即是有用的。而長時間未被訪問的數(shù)據(jù)，應(yīng)該被淘汰」

lru算法中數(shù)據(jù)會被放到一個鏈表中，鏈表的頭節(jié)點(diǎn)為最近被訪問的數(shù)據(jù)，鏈表的尾節(jié)點(diǎn)為長時間沒有被訪問的數(shù)據(jù)

「lru算法的核心實(shí)現(xiàn)就是哈希表加雙向鏈表」。鏈表可以用來維護(hù)訪問元素的順序，而hash表可以幫我們在O(1)時間復(fù)雜度下訪問到元素。

「至于為什么是雙向鏈表呢」？主要是要刪除元素，所以要獲取前繼節(jié)點(diǎn)。數(shù)據(jù)結(jié)構(gòu)圖示如下

使用雙向鏈表+HashMap

雙向鏈表節(jié)點(diǎn)定義如下

public class ListNode<K, V> {
    K key;
    V value;
    ListNode pre;
    ListNode next;

    public ListNode() {}

    public ListNode(K key, V value) {
        this.key = key;
        this.value = value;
    }
}

封裝雙向鏈表的常用操作

public class DoubleList {

    private ListNode head;
    private ListNode tail;

    public DoubleList() {
        head = new ListNode();
        tail = new ListNode();
        head.next = tail;
        tail.pre = head;
    }

    public void remove(ListNode node) {
        node.pre.next = node.next;
        node.next.pre = node.pre;
    }

    public void addLast(ListNode node) {
        node.pre = tail.pre;
        tail.pre = node;
        node.pre.next = node;
        node.next = tail;
    }

    public ListNode removeFirst() {
        if (head.next == tail) {
            return null;
        }
        ListNode first = head.next;
        remove(first);
        return first;
    }
}

封裝一個緩存類，提供最基本的get和put方法。「需要注意，這兩種基本的方法都涉及到對兩種數(shù)據(jù)結(jié)構(gòu)的修改」。

public class MyLruCache<K, V> {

    private int capacity;
    private DoubleList doubleList;
    private Map<K, ListNode> map;

    public MyLruCache(int capacity) {
        this.capacity = capacity;
        map = new HashMap<>();
        doubleList = new DoubleList();
    }

    public V get(Object key) {
        ListNode<K, V> node = map.get(key);
        if (node == null) {
            return null;
        }
        // 先刪除該節(jié)點(diǎn)，再接到尾部
        doubleList.remove(node);
        doubleList.addLast(node);
        return node.value;
    }

    public void put(K key, V value) {
        // 直接調(diào)用這邊的get方法，如果存在，它會在get內(nèi)部被移動到尾巴，不用再移動一遍,直接修改值即可
        if ((get(key)) != null) {
            map.get(key).value = value;
            return;
        }

        // 如果超出容量，把頭去掉
        if (map.size() == capacity) {
            ListNode listNode = doubleList.removeFirst();
            map.remove(listNode.key);
        }

        // 若不存在，new一個出來
        ListNode node = new ListNode(key, value);
        map.put(key, node);
        doubleList.addLast(node);
    }
}

這里我們的實(shí)現(xiàn)為最近訪問的放在鏈表的尾節(jié)點(diǎn)，不經(jīng)常訪問的放在鏈表的頭節(jié)點(diǎn)

測試一波，輸出為鏈表的正序輸出（代碼為了簡潔沒有貼toString方法）

MyLruCache<String, String> myLruCache = new MyLruCache<>(3);
// {5 : 5}
myLruCache.put("5", "5");
// {5 : 5}{3 : 3}
myLruCache.put("3", "3");
// {5 : 5}{3 : 3}{4 : 4}
myLruCache.put("4", "4");
// {3 : 3}{4 : 4}{2 : 2}
myLruCache.put("2", "2");
// {4 : 4}{2 : 2}{3 : 3}
myLruCache.get("3");

「因?yàn)長inkedHashMap的底層實(shí)現(xiàn)就是哈希表加雙向鏈表，所以你可以用LinkedHashMap替換HashMap和DoubleList來改寫一下上面的類」。

我來演示一下更騷的操作，只需要重寫一個構(gòu)造函數(shù)和removeEldestEntry方法即可。

使用LinkedHashMap實(shí)現(xiàn)LRU

public class LruCache<K, V> extends LinkedHashMap<K, V> {

    private int cacheSize;


    public LruCache(int cacheSize) {
        /**
         * initialCapacity: 初始容量大小
         * loadFactor: 負(fù)載因子
         * accessOrder: false基于插入排序（默認(rèn)），true基于訪問排序
         */
        super(cacheSize, 0.75f, true);
        this.cacheSize = cacheSize;
    }

    /**
     * 當(dāng)調(diào)用put或者putAll方法時會調(diào)用如下方法，是否刪除最老的數(shù)據(jù)，默認(rèn)為false
     */
    @Override
    protected boolean removeEldestEntry(Map.Entry<K, V> eldest) {
        return size() > cacheSize;
    }
}

注意這個緩存并不是線程安全的，可以調(diào)用Collections.synchronizedMap方法返回線程安全的map

LruCache<String, String> lruCache = new LruCache(3);
Map<String, String> safeMap = Collections.synchronizedMap(lruCache);

Collections.synchronizedMap實(shí)現(xiàn)線程安全的方式很簡單，只是返回一個代理類。代理類對Map接口的所有方法加鎖

public static <K,V> Map<K,V> synchronizedMap(Map<K,V> m) {
    return new SynchronizedMap<>(m);
}

LFU算法

「LRU算法有一個問題，當(dāng)一個長時間不被訪問的key，偶爾被訪問一下后，可能會造成一個比這個key訪問更頻繁的key被淘汰。」

即LRU算法對key的冷熱程度的判斷可能不準(zhǔn)確。而LFU算法（Least Frequently Used，最不經(jīng)常使用）則是按照訪問頻率來判斷key的冷熱程度的，每次刪除的是一段時間內(nèi)訪問頻率較低的數(shù)據(jù)，比LRU算法更準(zhǔn)確。

使用3個hash表實(shí)現(xiàn)lfu算法

那么我們應(yīng)該如何組織數(shù)據(jù)呢？

為了實(shí)現(xiàn)鍵值的對快速訪問，用一個map來保存鍵值對

private HashMap<K, Integer> keyToFreq;

還需要用一個map來保存鍵的訪問頻率

private HashMap<K, Integer> keyToFreq;

「當(dāng)然你也可以把值和訪問頻率封裝到一個類中，用一個map來替代上述的2個map」

接下來就是最核心的部分，刪除訪問頻率最低的數(shù)據(jù)。

為了能在O(1)時間復(fù)雜度內(nèi)找到訪問頻率最低的數(shù)據(jù)，我們需要一個變量minFreq記錄訪問最低的頻率
每個訪問頻率有可能對應(yīng)多個鍵。當(dāng)空間不夠用時，我們要刪除最早被訪問的數(shù)據(jù)，所以需要如下數(shù)據(jù)結(jié)構(gòu)，Map<頻率, 有序集合>。每次內(nèi)存不夠用時，刪除有序集合的第一個元素即可。并且這個有序集合要能快速刪除某個key，因?yàn)槟硞€key被訪問后，需要從這個集合中刪除，加入freq+1對應(yīng)的集合中
有序集合很多，但是能滿足快速刪除某個key的只有set，但是set插入數(shù)據(jù)是無序的。「幸虧JAVA有LinkedHashSet這個類，鏈表和集合的結(jié)合體，鏈表不能快速刪除元素，但是能保證插入順序。集合內(nèi)部元素?zé)o序，但是能快速刪除元素，完美」

下面就是具體的實(shí)現(xiàn)。

public class LfuCache<K, V> {

    private HashMap<K, V> keyToVal;
    private HashMap<K, Integer> keyToFreq;
    private HashMap<Integer, LinkedHashSet<K>> freqTokeys;

    private int minFreq;
    private int capacity;

    public LfuCache(int capacity) {
        keyToVal = new HashMap<>();
        keyToFreq = new HashMap<>();
        freqTokeys = new HashMap<>();
        this.capacity = capacity;
        this.minFreq = 0;
    }

    public V get(K key) {
        V v = keyToVal.get(key);
        if (v == null) {
            return null;
        }
        increaseFrey(key);
        return v;
    }

    public void put(K key, V value) {
        // get方法里面會增加頻次
        if (get(key) != null) {
            // 重新設(shè)置值
            keyToVal.put(key, value);
            return;
        }

        // 超出容量，刪除頻率最低的key
        if (keyToVal.size() >= capacity) {
            removeMinFreqKey();
        }

        keyToVal.put(key, value);
        keyToFreq.put(key, 1);
        // key對應(yīng)的value存在，返回存在的key
        // key對應(yīng)的value不存在，添加key和value
        freqTokeys.putIfAbsent(1, new LinkedHashSet<>());
        freqTokeys.get(1).add(key);
        this.minFreq = 1;
    }

    // 刪除出現(xiàn)頻率最低的key
    private void removeMinFreqKey() {
        LinkedHashSet<K> keyList = freqTokeys.get(minFreq);
        K deleteKey = keyList.iterator().next();
        keyList.remove(deleteKey);
        if (keyList.isEmpty()) {
            // 這里刪除元素后不需要重新設(shè)置minFreq
            // 因?yàn)閜ut方法執(zhí)行完會將minFreq設(shè)置為1
            freqTokeys.remove(keyList);
        }
        keyToVal.remove(deleteKey);
        keyToFreq.remove(deleteKey);
    }

    // 增加頻率
    private void increaseFrey(K key) {
        int freq = keyToFreq.get(key);
        keyToFreq.put(key, freq + 1);
        freqTokeys.get(freq).remove(key);
        freqTokeys.putIfAbsent(freq + 1, new LinkedHashSet<>());
        freqTokeys.get(freq + 1).add(key);
        if (freqTokeys.get(freq).isEmpty()) {
            freqTokeys.remove(freq);
            // 最小頻率的set為空，key被移動到minFreq+1對應(yīng)的set了
            // 所以minFreq也要加1
            if (freq == this.minFreq) {
                this.minFreq++;
            }
        }
    }
}

測試一下

LfuCache<String, String> lfuCache = new LfuCache(2);
lfuCache.put("1", "1");
lfuCache.put("2", "2");
// 1
System.out.println(lfuCache.get("1"));
lfuCache.put("3", "3");
// 1的頻率為2，2和3的頻率為1，但2更早之前被訪問，所以被清除
// 結(jié)果為null
System.out.println(lfuCache.get("2"));