CS61B 课程笔记（Lab 9：Tree Map 与 Hash Map | CS 61B Spring 2018)

1. BSTMap：基于二叉搜索树的 Map 实现

原理介绍：

BSTMap 使用二叉搜索树（Binary Search Tree, BST）作为其核心数据结构。二叉搜索树是一种二叉树，它的每个节点都包含一个键值对，并且具有以下性质：

左子树的所有键值小于当前节点的键值。
右子树的所有键值大于当前节点的键值。

这种结构使得在二叉搜索树中的查找、插入和删除操作的时间复杂度在平均情况下为 O(n)，最坏情况下（当树退化为链表时）为 \(O(n)\)。

BSTMap 的操作流程：

查找 (get)：
- 从根节点开始，依次与当前节点的键比较。
- 如果目标键比当前节点的键小，则递归在左子树查找。
- 如果目标键比当前节点的键大，则递归在右子树查找。
- 如果找到了目标键，则返回该节点对应的值。
插入 (put)：
- 和查找操作类似，首先找到合适的插入位置。
- 将新的键值对插入到合适的子树中。
- 如果树中已经存在该键，则更新其值。
计算大小 (size)：
- 递归遍历整棵树，计算节点总数。

代码实现（包含详细中文注释）：

public class BSTMap<K extends Comparable<K>, V> implements Map61B<K, V> {

    /** 定义树节点内部类，包含键、值及左右子树指针 */
    private class Node {
        private K key;        // 键
        private V value;      // 值
        private Node left, right;  // 左右子树

        Node(K key, V value) {
            this.key = key;
            this.value = value;
        }
    }

    private Node root;  // 根节点
    private int size;   // 树的大小（节点数）

    // 构造方法：初始化为空树
    public BSTMap() {
        this.root = null;
        this.size = 0;
    }

    /** 清空树 */
    @Override
    public void clear() {
        root = null;
        size = 0;
    }

    /** 查找指定键的值 */
    @Override
    public V get(K key) {
        return getHelper(root, key);
    }

    // 递归查找指定键的值
    private V getHelper(Node node, K key) {
        if (node == null) { // 如果树为空，返回 null
            return null;
        }
        int cmp = key.compareTo(node.key);
        if (cmp < 0) {
            return getHelper(node.left, key);  // 在左子树中查找
        } else if (cmp > 0) {
            return getHelper(node.right, key); // 在右子树中查找
        } else {
            return node.value;  // 找到键，返回对应的值
        }
    }

    /** 插入键值对 */
    @Override
    public void put(K key, V value) {
        root = putHelper(root, key, value);  // 调用递归插入函数
    }

    // 递归插入键值对，返回更新后的节点
    private Node putHelper(Node node, K key, V value) {
        if (node == null) {  // 如果当前节点为空，创建新节点
            size++;
            return new Node(key, value);
        }
        int cmp = key.compareTo(node.key);
        if (cmp < 0) {
            node.left = putHelper(node.left, key, value);   // 插入到左子树
        } else if (cmp > 0) {
            node.right = putHelper(node.right, key, value); // 插入到右子树
        } else {
            node.value = value;  // 如果键已经存在，更新值
        }
        return node;
    }

    /** 返回树的大小 */
    @Override
    public int size() {
        return size;
    }

    // 下面这些方法是实验中可选实现的，未实现的抛出异常
    @Override
    public Set<K> keySet() {
        throw new UnsupportedOperationException();
    }

    @Override
    public V remove(K key) {
        throw new UnsupportedOperationException();
    }

    @Override
    public Iterator<K> iterator() {
        throw new UnsupportedOperationException();
    }
}

2. MyHashMap：基于哈希表的 Map 实现

原理介绍：

MyHashMap 是基于哈希表（Hash Table）的映射实现。哈希表通过哈希函数将键映射到不同的“桶”（bucket）中，每个桶存储一组键值对。这样通过键的哈希值，可以快速定位到存储的桶，极大提高了查找速度。

哈希表的时间复杂度通常为 O(1)，因为可以通过哈希函数直接定位到目标桶。

哈希表的操作流程：

哈希函数 (hash)：
- 对键调用 hashCode() 方法，获取其哈希值，并通过取模操作将其映射到桶的索引。
查找 (get)：
- 通过哈希函数找到键对应的桶，从桶中查找键值对。
- 如果找到目标键，返回其对应的值。
插入 (put)：
- 通过哈希函数找到键对应的桶，插入键值对。
- 如果负载因子（元素个数/桶的数量）超过一定阈值，则需要扩容，将桶数量加倍。
扩容：
- 当负载因子超过设定的最大值（例如 0.75）时，进行扩容，将所有键值对重新分配到更大的桶数组中。

代码实现（包含详细中文注释）：

public class MyHashMap<K, V> implements Map61B<K, V> {
    private static final int DEFAULT_INITIAL_SIZE = 16;  // 默认初始桶大小
    private static final double MAX_LF = 0.75;  // 最大负载因子

    private ArrayMap<K, V>[] buckets;  // 存储键值对的桶数组
    private int size;  // 当前哈希表中存储的键值对数量
    private int capacity;  // 当前哈希表的容量（桶数量）

    // 默认构造方法，初始化哈希表
    public MyHashMap() {
        this(DEFAULT_INITIAL_SIZE);
    }

    // 带初始大小的构造方法
    public MyHashMap(int initialSize) {
        this.capacity = initialSize;
        this.size = 0;
        this.buckets = createTable(capacity);  // 创建桶数组
    }

    /** 清空哈希表 */
    @Override
    public void clear() {
        buckets = createTable(capacity);
        size = 0;
    }

    /** 计算哈希值，并将其映射到桶的索引 */
    private int hash(K key) {
        if (key == null) {
            return 0;
        }
        return Math.floorMod(key.hashCode(), capacity);
    }

    /** 查找指定键的值 */
    @Override
    public V get(K key) {
        int bucketIndex = hash(key);  // 通过哈希函数找到对应的桶
        return buckets[bucketIndex].get(key);  // 在桶中查找键值对
    }

    /** 插入键值对 */
    @Override
    public void put(K key, V value) {
        if ((double) size / capacity > MAX_LF) {  // 如果负载因子超过限制，扩容
            resize(2 * capacity);
        }
        int bucketIndex = hash(key);  // 通过哈希函数找到对应的桶
        if (!buckets[bucketIndex].containsKey(key)) {
            size++;  // 如果是新键，增加大小计数
        }
        buckets[bucketIndex].put(key, value);  // 插入键值对
    }

    /** 返回哈希表中键值对的数量 */
    @Override
    public int size() {
        return size;
    }

    /** 扩容操作，将桶数量加倍 */
    private void resize(int newCapacity) {
        ArrayMap<K, V>[] newBuckets = createTable(newCapacity);  // 创建新的桶数组
        for (ArrayMap<K, V> bucket : buckets) {  // 遍历旧桶
            for (K key : bucket.keySet()) {  // 遍历每个桶中的键值对
                int newIndex = Math.floorMod(key.hashCode(), newCapacity);  // 重新计算哈希值
                newBuckets[newIndex].put(key, bucket.get(key));  // 将键值对放入新桶
            }
        }
        this.capacity = newCapacity;  // 更新

容量
        this.buckets = newBuckets;  // 更新桶数组
    }

    // 其他未实现的方法抛出异常
    @Override
    public Set<K> keySet() {
        throw new UnsupportedOperationException();
    }

    @Override
    public V remove(K key) {
        throw new UnsupportedOperationException();
    }

    @Override
    public Iterator<K> iterator() {
        throw new UnsupportedOperationException();
    }
}

3. BSTMap 与 MyHashMap 的核心区别

特性	BSTMap（基于二叉搜索树）	MyHashMap（基于哈希表）
数据结构	二叉搜索树	哈希表
查找/插入时间复杂度	平均 \(O(\log n)\)，最坏 \(O(n)\)	平均 \(O(1)\)，最坏 \(O(n)\)
键的有序性	保持键的有序性（中序遍历能得到有序的键序列）	键的顺序是无序的
适用场景	适合需要频繁进行范围查询的场景	适合大数据量且需要快速查找、插入的场景
扩容机制	无需扩容，但最坏情况可能退化为链表结构	当负载因子过高时，需要进行扩容