排序算法 | 流年石刻

好的，我们来系统且深入地剖析桶排序（Bucket Sort）、基数排序（Radix Sort）和快速排序（Quick Sort）这三种经典的排序算法。我将遵循第一性原理，从它们各自的核心思想出发，逐步推演其实现逻辑、效率和适用场景。

排序算法的核心分野

在深入探讨之前，我们需要建立一个重要的认知：排序算法分为两大类。

比较排序 (Comparison Sorts): 这类算法通过比较元素之间的大小关系来决定它们的顺序。我们熟知的冒泡排序、插入排序、选择排序、归并排序、堆排序以及快速排序都属于这一类。比较排序算法的平均时间复杂度存在一个理论下限，即 O(nlogn)。它们不关心元素的具体数值，只关心它们之间的相对大小。
非比较排序 (Non-comparison Sorts): 这类算法不通过比较来排序，而是利用元素自身的特性（比如数值大小、构成部分）来确定其位置。它们的效率可以突破 O(nlogn) 的限制，达到线性时间 O(n)。桶排序和基数排序是其中的杰出代表。这类算法通常对数据有额外的要求，比如必须是整数或可以映射为整数。

理解这个分野是理解这三种算法各自定位和优劣势的关键。

快速排序 (Quick Sort)

快速排序是比较排序中的王者，因其在平均情况下的卓越性能而被广泛应用，例如 V8 引擎（JavaScript 的核心）内部的 Array.prototype.sort 在处理非稀疏数组时就主要基于快速排序的变体。

核心思想：分而治之 (Divide and Conquer)

快速排序的逻辑可以用三个词概括：选轴、分区、递归。

选轴 (Pivot Selection): 从待排序的数组中选择一个元素作为“基准”或“轴心”(Pivot)。这个选择至关重要，直接影响算法的效率。
分区 (Partition): 重新排列数组。将所有小于基准的元素移动到基准的左边，所有大于基准的元素移动到基准的右边。相等的元素可以放在任意一边。操作完成后，基准元素就处于其最终排序后的正确位置上。
递归 (Recursion): 对基准左边的子数组和右边的子数组分别重复上述过程，直到子数组的大小为 1 或 0，此时整个数组就有序了。

图解步骤

假设我们有数组 [8, 3, 5, 4, 7, 2, 9]，我们选择 7 作为基准 (Pivot)。

分区:
- 创建两个指针，left 从头开始，right 从尾（不含基准）开始。
- left 向右移动，直到找到一个大于等于基准的数 (8)。
- right 向左移动，直到找到一个小于基准的数 (2)。
- 交换 8 和 2。数组变为 [2, 3, 5, 4, 8, 7, 9]。
- 继续移动指针，直到 left 和 right 交错。
- 最后将基准 7 与 left 指针指向的元素 8 交换。
- 数组变为 [2, 3, 5, 4, 7, 8, 9]。此时，7 已经就位。
递归:
- 对 7 左边的子数组 [2, 3, 5, 4] 重复快速排序。
- 对 7 右边的子数组 [8, 9] 重复快速排序。

这个过程不断进行，直到所有元素都就位。

JavaScript 实现

一个健壮的快速排序实现通常会随机化基准的选择，以极大地避免最坏情况的发生。

JavaScript

/**
 * 交换数组中两个元素的位置
 * @param {Array<number>} arr 数组
 * @param {number} i 索引i
 * @param {number} j 索引j
 */
function swap(arr, i, j) {
    [arr[i], arr[j]] = [arr[j], arr[i]];
}

/**
 * 分区函数 (Lomuto partition scheme)
 * @param {Array<number>} arr 
 * @param {number} low 
 * @param {number} high 
 * @returns {number} 基准元素的最终索引
 */
function partition(arr, low, high) {
    // 选择最后一个元素作为基准
    const pivot = arr[high];
    // i 是小于基准的区域的右边界
    let i = low - 1;

    for (let j = low; j < high; j++) {
        // 如果当前元素小于基准
        if (arr[j] < pivot) {
            i++;
            // 将当前元素换到小于基准的区域
            swap(arr, i, j);
        }
    }
    // 将基准元素放到正确的位置（i+1）
    swap(arr, i + 1, high);
    return i + 1;
}

/**
 * 快速排序主函数
 * @param {Array<number>} arr 要排序的数组
 * @param {number} low 起始索引
 * @param {number} high 结束索引
 */
function quickSort(arr, low = 0, high = arr.length - 1) {
    if (low < high) {
        // 找到基准元素的索引
        const pivotIndex = partition(arr, low, high);

        // 递归地对基准左边的子数组进行排序
        quickSort(arr, low, pivotIndex - 1);
        // 递归地对基准右边的子数组进行排序
        quickSort(arr, pivotIndex + 1, high);
    }
    return arr;
}

// --- 优化：随机化基准避免最坏情况 ---
function randomizedQuickSort(arr, low = 0, high = arr.length - 1) {
    if (low < high) {
        // 随机选择一个元素作为基准，并将其与末尾元素交换
        const randomIndex = low + Math.floor(Math.random() * (high - low + 1));
        swap(arr, randomIndex, high);
        
        const pivotIndex = partition(arr, low, high);
        randomizedQuickSort(arr, low, pivotIndex - 1);
        randomizedQuickSort(arr, pivotIndex + 1, high);
    }
    return arr;
}


// 示例
const numbers = [8, 3, 5, 4, 7, 2, 9, 1, 6];
console.log("Original:", numbers);
console.log("Sorted:", randomizedQuickSort(numbers)); // 使用随机化版本更稳妥

复杂度与特性分析

时间复杂度:
- 平均情况: O(nlogn)。每次分区操作的时间是 O(n)。在理想情况下，每次基准都能将数组平分为两半，递归深度为 logn。总时间就是 O(nlogn)。随机化基准让算法极大概率达到这个性能。
- 最坏情况: O(n2)。当每次选择的基准都是当前数组的最小值或最大值时（例如，对一个已经排好序的数组，每次都选最后一个元素做基准），递归树严重不平衡，深度变为 n，导致总时间为 O(n2)。
- 最好情况: O(nlogn)。
空间复杂度:
- 平均情况: O(logn)。主要开销是递归调用栈的深度。
- 最坏情况: O(n)。当递归树退化成链表时。
稳定性: 不稳定。在分区过程中，与基准相等的多个元素的相对位置可能会被改变。例如 [5, 8, 5, 2, 9]，若以 8 为基准，第一个 5 可能被交换到后面。

适用场景

快速排序是通用场景下最快的内部排序算法之一。当你需要对一个内存中的大型、无序、元素类型不限（只要能比较）的数组进行排序时，它通常是首选。但要注意防范最坏情况的发生，随机化是简单有效的手段。

桶排序 (Bucket Sort)

桶排序是非比较排序的代表，它的核心思想是“空间换时间”。

核心思想：映射与分散

桶排序假设输入数据服从均匀分布，然后将数据根据其数值大小，通过一个映射函数，分配到有限数量的“桶”(Bucket)里。每个桶再分别进行排序（可以使用其他排序算法，如插入排序，甚至递归使用桶排序），最后按顺序将所有非空桶中的元素合并起来，得到有序的结果。

图解步骤

假设我们有数组 [0.78, 0.17, 0.39, 0.26, 0.72, 0.94, 0.21, 0.12]，我们要把它们分到 5 个桶里。

创建桶: 创建 5 个空桶，编号 0 到 4。
映射与入桶:
- 映射函数可以是 f(x) = floor(n * x)，这里 n=5。
- 0.78 -> floor(5 * 0.78) -> floor(3.9) -> 桶 3
- 0.17 -> floor(5 * 0.17) -> floor(0.85) -> 桶 0
- ...以此类推，将所有元素放入对应桶中。
- 桶 0: [0.17, 0.12]
- 桶 1: [0.26, 0.21]
- 桶 2: [0.39]
- 桶 3: [0.78, 0.72]
- 桶 4: [0.94]
桶内排序: 对每个非空桶分别进行排序。
- 桶 0: [0.12, 0.17]
- 桶 1: [0.21, 0.26]
- 桶 2: [0.39]
- 桶 3: [0.72, 0.78]
- 桶 4: [0.94]
合并: 按顺序拼接所有桶的元素。
- [0.12, 0.17, 0.21, 0.26, 0.39, 0.72, 0.78, 0.94]

JavaScript 实现

JavaScript

/**
 * 插入排序，用于对小规模的桶进行排序
 * @param {Array<number>} arr
 * @returns {Array<number>}
 */
function insertionSort(arr) {
    for (let i = 1; i < arr.length; i++) {
        let current = arr[i];
        let j = i - 1;
        while (j >= 0 && arr[j] > current) {
            arr[j + 1] = arr[j];
            j--;
        }
        arr[j + 1] = current;
    }
    return arr;
}

/**
 * 桶排序
 * @param {Array<number>} arr 要排序的数组
 * @param {number} bucketSize 每个桶的大小（或桶的数量）
 * @returns {Array<number>}
 */
function bucketSort(arr, bucketSize = 5) {
    if (arr.length === 0) {
        return arr;
    }

    // 1. 找到最大值和最小值，以确定数据范围
    let min = arr[0];
    let max = arr[0];
    for (let i = 1; i < arr.length; i++) {
        if (arr[i] < min) {
            min = arr[i];
        } else if (arr[i] > max) {
            max = arr[i];
        }
    }

    // 2. 创建桶
    const bucketCount = Math.floor((max - min) / bucketSize) + 1;
    const buckets = new Array(bucketCount);
    for (let i = 0; i < buckets.length; i++) {
        buckets[i] = [];
    }

    // 3. 将元素分配到桶中
    for (let i = 0; i < arr.length; i++) {
        const bucketIndex = Math.floor((arr[i] - min) / bucketSize);
        buckets[bucketIndex].push(arr[i]);
    }

    // 4. 对每个桶进行排序，并合并结果
    const sortedArr = [];
    for (let i = 0; i < buckets.length; i++) {
        if (buckets[i].length > 0) {
            // 对每个桶进行排序，这里使用插入排序
            insertionSort(buckets[i]);
            // 展开桶内元素并添加到结果数组
            sortedArr.push(...buckets[i]);
        }
    }

    return sortedArr;
}

// 示例
const numbers = [29, 25, 3, 49, 9, 37, 21, 43];
console.log("Original:", numbers);
// bucketSize 设为 10，则桶 0 放 0-9，桶 1 放 10-19...
console.log("Sorted:", bucketSort(numbers, 10));

复杂度与特性分析

时间复杂度:
- 平均情况: O(n+k)。其中 n 是元素数量，k 是桶的数量。遍历一遍数组将元素放入桶中是 O(n)。如果数据均匀分布，每个桶里有约 n/k 个元素，对每个桶排序的时间为 O((n/k)log(n/k))（如果用快排）或 O((n/k)2)（如果用插入排序）。总时间约为 O(n)+kcdotO((n/k)2)。当 k 约等于 n 时，每个桶内只有常数个元素，排序时间为 O(1)，总时间趋近于 O(n)。
- 最坏情况: O(n2) (或 O(nlogn)，取决于桶内排序算法)。当所有元素都落入同一个桶中，桶排序退化为桶内使用的排序算法的复杂度。
空间复杂度: O(n+k)。需要额外的空间来存储 k 个桶和 n 个元素。
稳定性: 稳定 (取决于桶内排序算法的稳定性)。如果桶内排序算法是稳定的（如插入排序、计数排序），并且我们将元素追加到桶的末尾，那么整个桶排序就是稳定的。

适用场景

桶排序极度依赖于输入数据。它最适用于：

数据是浮点数或整数，且范围已知。
数据在整个范围内大致呈均匀分布。如果数据分布极不均匀，其性能会急剧下降。

延伸思考：计数排序 (Counting Sort)

计数排序是桶排序的一个特例。当桶的大小为 1 时，即每个桶只对应一个确定的整数值，桶排序就变成了计数排序。计数排序的核心是统计每个整数出现的次数，然后根据统计结果直接写回原数组。它的时间复杂度为 O(n+r)，其中 r 是数据的范围（最大值-最小值）。它非常高效，但对数据范围敏感。

基数排序 (Radix Sort)

基数排序同样是非比较排序，它非常巧妙，不比较整个数字的大小，而是按“位”来排序。它通常被用于排序整数，尤其是位数较短的大量整数。

核心思想：按位分配与收集

基数排序将所有待排序的数字（通常是正整数）统一为相同的位数（位数不足的在前面补 0），然后从最低位 (Least Significant Digit, LSD) 开始，依次对每一位进行排序，直到最高位 (Most Significant Digit, MSD)。

关键在于，每一位的排序必须是稳定的。也就是说，在按某一位排序后，相同数值的元素必须保持它们在前一轮排序中的相对顺序。这通常通过计数排序作为其子过程来实现。

图解步骤

假设我们有数组 [170, 45, 75, 90, 802, 24, 2, 66]。

按个位 (LSD) 排序:
- 170 (0), 90 (0), 802 (2), 2 (2), 24 (4), 45 (5), 75 (5), 66 (6)
- 根据个位数，使用稳定的排序（如计数排序）重新排列。
- 结果: [170, 90, 802, 2, 24, 45, 75, 66] (注意 170 在 90 前面，802 在 2 前面)
按十位排序:
- 802 (0), 2 (0), 24 (2), 45 (4), 66 (6), 170 (7), 75 (7), 90 (9)
- 根据十位数，对上一轮的结果进行稳定排序。
- 结果: [802, 2, 24, 45, 66, 170, 75, 90] (注意 802 仍在 2 前面，170 仍在 75 前面)
按百位排序:
- 2 (0), 24 (0), 45 (0), 66 (0), 75 (0), 90 (0), 170 (1), 802 (8)
- 根据百位数，对上一轮的结果进行稳定排序。
- 结果: [2, 24, 45, 66, 75, 90, 170, 802]

排序完成。

JavaScript 实现

基数排序的实现通常依赖于一个稳定的子排序，这里我们用类似计数排序的桶分配方法。

JavaScript

/**
 * 基数排序 (LSD - Least Significant Digit)
 * @param {Array<number>} arr 要排序的数组
 * @returns {Array<number>}
 */
function radixSort(arr) {
    if (arr.length < 2) {
        return arr;
    }

    // 1. 找到数组中的最大值，以确定最大位数
    const max = Math.max(...arr);
    const maxDigits = Math.floor(Math.log10(max)) + 1;

    let mod = 10;
    let dev = 1;

    for (let i = 0; i < maxDigits; i++, dev *= 10, mod *= 10) {
        // 创建 10 个桶 (0-9)
        const buckets = [];
        for (let j = 0; j < 10; j++) {
            buckets.push([]);
        }

        // 2. 将数字根据当前位的数值分配到桶中
        for (let j = 0; j < arr.length; j++) {
            // 获取当前位的数字
            const bucketIndex = Math.floor((arr[j] % mod) / dev);
            buckets[bucketIndex].push(arr[j]);
        }

        // 3. 按桶的顺序（0-9）将元素收集回来
        let pos = 0;
        for (let j = 0; j < buckets.length; j++) {
            let value = null;
            while ((value = buckets[j].shift()) != null) {
                arr[pos++] = value;
            }
        }
    }

    return arr;
}

// 示例
const numbers = [170, 45, 75, 90, 802, 24, 2, 66];
console.log("Original:", numbers);
console.log("Sorted:", radixSort(numbers));

复杂度与特性分析

时间复杂度: O(dcdot(n+k)) 或简写为 O(dcdotn)。
- d: 数组中最大数字的位数。
- n: 数组元素的个数。
- k: 基数，即桶的数量。对于十进制数，k=10。
- 每一轮分配和收集都是 O(n+k) 的。总共要进行 d 轮。由于 k 通常是常数（如10），所以复杂度可以看作是线性的 O(dcdotn)。
空间复杂度: O(n+k)。需要 k 个桶来存放 n 个元素。
稳定性: 稳定。基数排序的正确性强依赖于其内部排序的稳定性。我们的实现中，将元素顺序推入桶中，再顺序取出，保证了稳定性。

适用场景

基数排序是特定场景下的效率之王：

待排序的元素是整数（或可以被不失真地映射为整数，如特定格式的字符串）。
元素的位数 d 相对较小。如果 d 过大（例如，64位长整数），d 这个常数因子会变得很大，可能反而不如 O(nlogn) 的快速排序。
海量数据排序。当 n 非常大时，线性时间复杂度的优势会完全体现出来。例如，对全国所有人的年龄进行排序。

总结与最终选择

特性 / 算法	快速排序 (Quick Sort)	桶排序 (Bucket Sort)	基数排序 (Radix Sort)
核心思想	分而治之，基准分区	空间换时间，映射分散	按位排序，稳定收集
类别	比较排序	非比较排序	非比较排序
时间复杂度 (平均)	O(nlogn)	O(n+k)	O(dcdotn)
时间复杂度 (最坏)	O(n2)	O(n2) 或 O(nlogn)	O(dcdotn)
空间复杂度	O(logn) (平均)	O(n+k)	O(n+k)
稳定性	不稳定	稳定 (取决于内部)	稳定
数据要求	元素可比较即可	数值型，均匀分布	整数或可映射为整数

如何选择？我的最终建议

这三种排序算法并非相互替代的关系，而是针对不同问题域的“专科医生”。

默认和通用首选：快速排序 (Randomized)
- 当你面对一个未知的数据集，不确定其分布，且元素可能是任意可比较类型（不只是数字），随机化的快速排序是你的第一选择。它的平均性能极其出色，空间效率高（接近原地排序），且实现相对简单，是名副其实的“通用排序之王”。
数据分布均匀时的利器：桶排序
- 如果你的数据是数值型，并且你有理由相信它们大致均匀地分布在一个已知的范围内（例如，大量的随机生成的浮点数），桶排序可以提供惊人的线性时间性能。但一定要警惕数据倾斜，否则它会退化成一个低效的排序。
整数排序的终极武器：基数排序
- 当你的任务是对大量的整数进行排序时，基数排序是目前最快的算法。它的性能稳定，不受数据初始顺序和分布的影响，只要整数的位数不是天文数字，它就能以压倒性的线性时间优势胜出。特别是在处理身份证号、电话号码（转换后）这类位数固定的长整数时，它的威力无人能及。

结论：没有“最好”的算法，只有“最适合”的算法。理解它们各自的底层逻辑和约束条件，是做出正确技术选型的根本。如果必须给出一个在工程实践中最常被信赖的答案，那就是经过优化的快速排序，因为它在普适性和平均性能之间取得了最佳的平衡。但对于特定问题，巧妙地运用桶排序或基数排序，能让你写出性能远超通用库的程序。

/** * 交换数组中两个元素的位置 * @param {Array<number>} arr 数组 * @param {number} i 索引i * @param {number} j 索引j */ function swap(arr, i, j) { [arr[i], arr[j]] = [arr[j], arr[i]]; } /** * 分区函数 (Lomuto partition scheme) * @param {Array<number>} arr * @param {number} low * @param {number} high * @returns {number} 基准元素的最终索引 */ function partition(arr, low, high) { // 选择最后一个元素作为基准 const pivot = arr[high]; // i 是小于基准的区域的右边界 let i = low - 1; for (let j = low; j < high; j++) { // 如果当前元素小于基准 if (arr[j] < pivot) { i++; // 将当前元素换到小于基准的区域 swap(arr, i, j); } } // 将基准元素放到正确的位置（i+1） swap(arr, i + 1, high); return i + 1; } /** * 快速排序主函数 * @param {Array<number>} arr 要排序的数组 * @param {number} low 起始索引 * @param {number} high 结束索引 */ function quickSort(arr, low = 0, high = arr.length - 1) { if (low < high) { // 找到基准元素的索引 const pivotIndex = partition(arr, low, high); // 递归地对基准左边的子数组进行排序 quickSort(arr, low, pivotIndex - 1); // 递归地对基准右边的子数组进行排序 quickSort(arr, pivotIndex + 1, high); } return arr; } // --- 优化：随机化基准避免最坏情况 --- function randomizedQuickSort(arr, low = 0, high = arr.length - 1) { if (low < high) { // 随机选择一个元素作为基准，并将其与末尾元素交换 const randomIndex = low + Math.floor(Math.random() * (high - low + 1)); swap(arr, randomIndex, high); const pivotIndex = partition(arr, low, high); randomizedQuickSort(arr, low, pivotIndex - 1); randomizedQuickSort(arr, pivotIndex + 1, high); } return arr; } // 示例 const numbers = [8, 3, 5, 4, 7, 2, 9, 1, 6]; console.log("Original:", numbers); console.log("Sorted:", randomizedQuickSort(numbers)); // 使用随机化版本更稳妥

/** * 插入排序，用于对小规模的桶进行排序 * @param {Array<number>} arr * @returns {Array<number>} */ function insertionSort(arr) { for (let i = 1; i < arr.length; i++) { let current = arr[i]; let j = i - 1; while (j >= 0 && arr[j] > current) { arr[j + 1] = arr[j]; j--; } arr[j + 1] = current; } return arr; } /** * 桶排序 * @param {Array<number>} arr 要排序的数组 * @param {number} bucketSize 每个桶的大小（或桶的数量） * @returns {Array<number>} */ function bucketSort(arr, bucketSize = 5) { if (arr.length === 0) { return arr; } // 1. 找到最大值和最小值，以确定数据范围 let min = arr[0]; let max = arr[0]; for (let i = 1; i < arr.length; i++) { if (arr[i] < min) { min = arr[i]; } else if (arr[i] > max) { max = arr[i]; } } // 2. 创建桶 const bucketCount = Math.floor((max - min) / bucketSize) + 1; const buckets = new Array(bucketCount); for (let i = 0; i < buckets.length; i++) { buckets[i] = []; } // 3. 将元素分配到桶中 for (let i = 0; i < arr.length; i++) { const bucketIndex = Math.floor((arr[i] - min) / bucketSize); buckets[bucketIndex].push(arr[i]); } // 4. 对每个桶进行排序，并合并结果 const sortedArr = []; for (let i = 0; i < buckets.length; i++) { if (buckets[i].length > 0) { // 对每个桶进行排序，这里使用插入排序 insertionSort(buckets[i]); // 展开桶内元素并添加到结果数组 sortedArr.push(...buckets[i]); } } return sortedArr; } // 示例 const numbers = [29, 25, 3, 49, 9, 37, 21, 43]; console.log("Original:", numbers); // bucketSize 设为 10，则桶 0 放 0-9，桶 1 放 10-19... console.log("Sorted:", bucketSort(numbers, 10));

/** * 基数排序 (LSD - Least Significant Digit) * @param {Array<number>} arr 要排序的数组 * @returns {Array<number>} */ function radixSort(arr) { if (arr.length < 2) { return arr; } // 1. 找到数组中的最大值，以确定最大位数 const max = Math.max(...arr); const maxDigits = Math.floor(Math.log10(max)) + 1; let mod = 10; let dev = 1; for (let i = 0; i < maxDigits; i++, dev *= 10, mod *= 10) { // 创建 10 个桶 (0-9) const buckets = []; for (let j = 0; j < 10; j++) { buckets.push([]); } // 2. 将数字根据当前位的数值分配到桶中 for (let j = 0; j < arr.length; j++) { // 获取当前位的数字 const bucketIndex = Math.floor((arr[j] % mod) / dev); buckets[bucketIndex].push(arr[j]); } // 3. 按桶的顺序（0-9）将元素收集回来 let pos = 0; for (let j = 0; j < buckets.length; j++) { let value = null; while ((value = buckets[j].shift()) != null) { arr[pos++] = value; } } } return arr; } // 示例 const numbers = [170, 45, 75, 90, 802, 24, 2, 66]; console.log("Original:", numbers); console.log("Sorted:", radixSort(numbers));

特性 / 算法

快速排序 (Quick Sort)

桶排序 (Bucket Sort)

基数排序 (Radix Sort)

核心思想

分而治之，基准分区

空间换时间，映射分散

按位排序，稳定收集

类别

比较排序

非比较排序

时间复杂度 (平均)

O(nlogn)

O(n+k)

O(dcdotn)

时间复杂度 (最坏)

O(n2)

O(n2) 或 O(nlogn)

O(dcdotn)

空间复杂度

O(logn) (平均)

O(n+k)

稳定性

不稳定

稳定 (取决于内部)

稳定

数据要求

元素可比较即可

数值型，均匀分布

整数或可映射为整数