关于排序,有一些术语,例如算法的稳定/不稳定,内排序和外排序等,需要我们了解一下
稳定:当未排序时a在b前面且a=b,排序后a仍然在b前面
不稳定:当未排序时a在b前面且a=b,排序后a可能会出现在b后面
内排序:数据记录在内存中进行排序
外排序:由于数据太大,在排序过程中需要访问外存
冒泡排序的效率十分低下,但是胜在排序过程形象易懂,适用于教学使用。
通过对数列的遍历并比较相邻的元素,将目标元素逐步移动到数组的尾端,就像泡泡慢慢冒出水面,因此得名。
(1)从头到尾比较相邻元素,如果第一个大于第二个(升序)就将二者交换位置
(2)重复n-1遍第一步(最后一个元素一定是最小的所以不用排了)
void BubbleSort(int* a, int n) //冒泡排序 { for (int i = 0; i < n - 1; i++) //重复n-1次 { for (int j = 1; j < n - i; j++) //单趟冒泡排序 { if (a[j - 1] > a[j]) { int tmp = a[j]; //交换元素 a[j] = a[j - 1]; a[j - 1] = tmp; } } } }
如果遍历一遍数组后没有发生任何元素交换,说明数组已经有序,排序就可以结束了。
优化后的代码如下:
void BubbleSort(int* a, int n) //冒泡排序 { for (int i = 0; i < n; i++) { bool flag = false; //flag每次循环重置为false for (int j = 1; j < n - i; j++) { if (a[j - 1] > a[j]) { int tmp = a[j]; a[j] = a[j - 1]; a[j - 1] = tmp; flag = true; //如果发生元素交换,flag赋值为true } } if (flag == false) //如果单趟冒泡后flag没有发生改变说明已经有序 break; } }
选择排序是表现最稳定的算法之一,但它的效率也很低下,无论情况的好与坏它的时间复杂度都是O(n2)。
(1)遍历未排序的部分找出最小值(升序),将其与未排序部分的第一个元素交换
(2)重复n-1遍第一步(最后一个元素一定是最大的所以不用排了)
上面的动图中每次遍历只寻找最小值,我们可以优化一下,每次遍历同时寻找最大值和最小值。
void SelectSort(int* a, int n) //选择排序 { int begin = 0, end = n - 1; int tmp = 0; while (begin < end) { int min = begin; int max = begin; for (int i = begin; i <= end; i++) //遍历寻找最大和最小值 { if (a[i] > a[max]) max = i; //保存最大值的下标 if (a[i] < a[min]) min = i; //保存最小值的下标 } tmp = a[begin]; //将最小值交换到前面 a[begin] = a[min]; a[min] = tmp; if (max == begin) { //最大值如果恰好在begin处,通过交换就到了min的位置,需要更新下标 max = min; } tmp = a[end]; //将最大值交换到后面 a[end] = a[max]; a[max] = tmp; begin++; //更新头部位置 end--; //更新尾部位置 } }
插入排序的逻辑十分简单,将待排序的元素一个个插入到一个已经排好序的有序数列中,直到整个数列都有序为止。
过年的时候我们打扑克牌,将一堆无序的牌变得有序的过程实际上就是运用了插入排序的思想。
(1)只有一个元素时默认有序,所以我们跳过第一个元素
(2)取出下一个元素,在已经排好序的序列中从后向前扫描并与取出的元素对比
(3)如果扫描到的元素大于取出的元素(升序),就将扫描的元素向后移一位
(4)重复步骤3,直到扫描到的元素小于或等于取出的元素,将取出的元素放入有序数列
(5)重复步骤2~5
void InsertSort(int* a, int n) //插入排序 { for (int i = 1; i < n; i++) { int end = i - 1; //有序序列的尾部位置 int tmp = a[i]; //取出待排序元素 while (end >= 0) //扫描有序序列 { if (tmp < a[end]) //扫描到的元素大于取出的元素 { a[end + 1] = a[end]; //将其向后移一位 end--; //从后向前扫描 } else //找到合适的位置 { break; } } a[end + 1] = tmp; //将取出的元素插入 } }
希尔排序又称缩小增量排序,它也是插入排序的一种,由希尔(Donald Shell)于1959年提出,也是时间复杂度冲破O(n2)的第一批算法之一。
(1)设定一个gap,并按照gap将待排序数列分割成若干子序列,对子序列分别进行插入排序
(2)将gap缩小,重复步骤1,当gap=1时就是插入排序
void ShellSort(int* a, int n) //希尔排序 { int gap = n; while (gap > 1) { gap = gap / 3 + 1; for (int i = 0; i < n - gap; i++) { int end = i; int tmp = a[end + gap]; while (end >= 0) { if (a[end] > tmp) { a[end + gap] = a[end]; end -= gap; } else break; } a[end + gap] = tmp; } } }
希尔排序是对插入排序的优化,当gap>1时都是预排序,目的是让数组不断趋近有序;当gap为1时数组已经很接近有序了,所以排起来就会很快。
堆排序(Heapsort)是指利用堆积树(堆)这种数据结构所设计的一种排序算法,是选择排序的一种,通过堆来进行选择数据。
在前面学习数据结构堆的时候我们已经见过堆排序了,这里不再赘述。
(1)先建堆,升序建大堆,降序建小堆
(2)将堆顶元素与堆尾元素互换,并排除出堆
(3)此时堆的性质被打破,通过向下调整算法调整为新的堆,重复操作2直至序列有序
typedef int HPDataType; typedef struct Heap { HPDataType* arr; int size; int capacity; }Heap; void AdjustDown(int* a, int n, int root) //向下调整算法 { int child = root * 2 + 1; while (child < n) { if (child + 1 < n && a[child + 1] > a[child]) { child = child + 1; } if (a[child] > a[root]) { HPDataType tmp = a[child]; a[child] = a[root]; a[root] = tmp; root = child; child = root * 2 + 1; } else { break; } } } void HeapSort(int* a, int n) //堆排序 { for (int i = (n - 1 - 1) / 2; i >= 0; i--) { AdjustDown(a, n, i); //通过向下调整算法建堆 } while (n > 1) { int tmp = a[0]; //将堆顶元素交换到堆尾 a[0] = a[n - 1]; a[n - 1] = tmp; n--; //排除原堆顶元素 AdjustDown(a, n, 0); //调整被打乱的堆 } }
快速排序是本文的重头戏,它是对冒泡排序的一种改进算法,在当前所有的内部排序算法中,快速排序被认为是最好的排序算法之一。
(1)任选待排序序列中的某元素作为基准值,按照该值通过单趟排序将待排序的序列分为左右两个子序列,左子序列中的元素均小于基准值,右子序列中的元素均大于基准值(升序)
(2)分别对左右两个子序列重复步骤1,直至序列有序
不同版本的快排核心思想都是一样的,区别在于单趟排序的方式不同
(1)选定待排序序列头部(或尾部)的元素作为key值,保存下标
(2)扫描待排序序列,一个从左到右寻找比key大的值,另一个从右向左寻找比key小的值,找到后将二者交换。
(3)当待排序序列扫描结束后,将序列头部的key与left位置处的元素交换,并返回left(此时left是key值的下标)
int PartSort(int* a, int left, int right) //单趟排序hoare版本 { //left从待排序序列头部向后走,right从待排序序列尾部向前走 int key = left; //将待排序序列的第一个元素作为key值 while (left < right) //left小于right说明单趟排序没结束 { while (left < right && a[right] >= a[key]) //right位置的值不比key小时向前走 { right--; } while (left < right && a[left] <= a[key]) //left位置的值不比key大时向后走 { left++; } tmp = a[left]; //此时right位置的值比key小,left位置的值比key大 a[left] = a[right]; //二者交换 a[right] = tmp; } tmp = a[key]; //把序列头部作为key值的元素交换到left位置,完成单趟排序 a[key] = a[left]; a[left] = tmp; return left; //返回left位置存放的key值 }
(1)将待排序序列头部的元素存放到一个临时变量中作为key值,将key值原先的位置作为坑位
(2)从右往左寻找比key小的值,找到后将其填入坑中,并且其原来的位置成为新的坑
(3)从左往右寻找比key大的值,找到后将其填入坑中,并且其原来的位置成为新的坑
(4)重复步骤2~3直到待排序序列扫描完毕
(5)最后将key值填入坑中,返回key值下标
int PartSort(int* a, int left, int right) //单趟排序挖坑法 { int tmp = a[left]; int hole = left; while (left < right) { while (left < right && a[right] >= tmp) { right--; } a[hole] = a[right]; hole = right; while (left < right && a[left] <= tmp) { left++; } a[hole] = a[left]; hole = left; } a[hole] = tmp; return left; }
(1)prev指针指向待排序序列开头,cur指针指向prev的下一个位置,将序列头部元素作为key值
(2)cur向后走寻找比key小的值,如果找到则prev++,并交换元素
(3)重复步骤2直到cur走到结尾,将key值与prev位置的值交换并返回key值此时的下标
int PartSort(int* a, int left, int right) //单趟排序前后指针法 { int midi = GetMidIndex(a, left, right); Swap(&a[left], &a[midi]); int key = left; int prev = left; int cur = left + 1; while (cur < right + 1) { if (a[cur] < a[key]) { prev++; tmp = a[cur]; a[cur] = a[prev]; a[prev] = tmp; } cur++; } tmp = a[key]; a[key] = a[prev]; a[prev] = tmp; return prev; }
快排是一种二叉树结构的交换排序算法,因此我们可以用递归实现。
用递归实现快排比较简单,这里直接放代码
void QuickSort(int* a, int left, int right) //递归实现快排 { if (left >= right) return; int key = PartSort(a, left, right); QuickSort(a, left, key - 1); QuickSort(a, key + 1, right); }
非递归的方式需要用到栈,通过对待排序区间下标的压栈和出栈来实现快排
(1)首先将待排序序列尾部的下标压入栈中,再将头部的下标压入栈中(因为后面出栈要先取出头部再取出尾部,栈的特性是后进先出)
(2)取两次栈顶元素,分别取出序列头部和尾部的下标,对这一区间进行单趟排序后获取key值的下标
(3)当key值不与原区间头部或尾部相邻时,以key值为分界将先前的区间拆分成两部分,分别压入栈中
(4)重复步骤2~3直到栈为空
void QuickSortNonR(int* a, int left, int right) //非递归实现快排 { Stack st; StackInit(&st); StackPush(&st, right); StackPush(&st, left); while (!StackEmpty(&st)) { int begin = StackTop(&st); StackPop(&st); int end = StackTop(&st); StackPop(&st); int keyi = PartSort2(a, begin, end); if (keyi + 1 < end) { StackPush(&st, end); StackPush(&st, keyi + 1); } if (begin < keyi - 1) { StackPush(&st, keyi - 1); StackPush(&st, begin); } } }
具体关于栈的实现可以前往 数据结构——栈-CSDN博客 查看
快速排序虽然效率高,但是还是有缺陷的。
当快排在排序大量有序或者接近有序的序列时,选择的key容易恰好为最小值,效率比较低下,会进行一些不必要的递归。
当递归调用层数过深,会导致栈溢出的情况,这里我们可以使用三数取中的办法来对这种情况进行优化。
三数取中,就是对比待排序序列头部的值、中部的值和尾部的值,选出三者中既不是最大也不是最小的值作为key值,并放到序列头部
其代码实现如下:
int GetMidIndex(int* a, int left, int right)//三数取中 { int mid = (left + right) / 2; if (a[left] > a[mid]) { if (a[mid] > a[right]) return mid; else if (a[left] > a[right]) return right; else return left; } else { if (a[mid] < a[right]) return mid; else if (a[left] < a[right]) return right; else return left; } }
具体的使用,我们只需要在单趟排序代码的开头加上这么一段就行:
int midi = GetMidIndex(a, left, right); tmp = a[left]; a[left] = a[midi]; a[midi] = tmp;
快排在排序一个数据量为100万的无序序列时只需要递归20层,但排序一个8个数据的无序序列时就要递归3层。
在递归出的二叉树结构中,最底部的三层的递归次数竟然占用了全部递归次数的87.5%!
因此我们可以对递归实现快排的代码进行优化,当区间的数据量较小时,转为使用其他的排序算法
本质上是为了减少递归调用次数来提高效率
这里我们可以使用插入排序来排序数据量较小的区间
void QuickSort(int* a, int left, int right) //小区间优化版快排 { if (left >= right) return; if (right - left + 1 < 10) { InsertSort(a + left, right - left + 1); return; } int key = PartSort2(a, left, right); QuickSort(a, left, key - 1); QuickSort(a, key + 1, right); }
小区间优化的思想对递归实现归并排序也tong'yang'sh
虽然三数取中法能解决待排序序列有序或接近有序的情况,但是如果序列中有大量的元素和key相等,甚至整个序列所有元素都相等时,三数取中也无法解决这种情况
这时需要使用三路划分的思想
三路划分的大体思路:
(1)begin指向区间头部,cur指向begin的下一个位置,end指向区间尾部,以头部元素作为key
(2) 如果cur处的值小于key,则将begin和cur处的元素交换,二者各向后一步
(3)如果cur处的值等于key,则cur向后走一步
(4)如果cur处的值大于key,则将cur和end处的元素交换,cur向前走一步
(5)重复以上步骤直到cur > end时结束
(6)对左边小于key的部分和右边大于key的部分进行递归
三路划分的代码实现:
void QuickSortThreeWay(int* a, int left, int right)//三路划分版快排 { if (left >= right) return; int begin = left; int end = right; int cur = begin + 1; int key = a[left]; while (cur <= end) { if (a[cur] < key) { Swap(&a[cur], &a[begin]); cur++; begin++; } else if (a[cur] > key) { Swap(&a[cur], &a[end]); end--; } else { cur++; } } QuickSort(a, left, begin - 1); QuickSort(a, end + 1, right); }
归并排序的核心思想:分治
分治就是将一个复杂的问题分解成子问题,子问题再分解成更小子问题,直到最后子问题可以简单求解。在求二叉树的节点个数和二叉树的高度时我们也使用过这个思想。
将待排序的序列分解为两个子序列,再将子序列继续分解,直到每个子序列中只有一个元素,此时默认有序。再将有序的子序列逐渐归并到一起。
若将两个有序子序列合并成一个序列,称为二路归并。归并排序的逻辑图如下:
(1)malloc一块和待排序序列大小相同的空间,用来临时存放归并后的序列
(2)通过递归或迭代将待排序序列拆分多个子序列
(3)子序列间两两归并到开辟出的空间中,具体操作可以参考两个有序数组合并
(4)将归并后的子序列用memcpy覆盖到原序列中
(5)重复上述操作直到序列有序
(1)通过递归将待排序序列不断的对半分,直到分出的子序列中只有一个元素
(2)计算出相邻两个子序列区间的边界,对二者进行归并
我们不能每次递归都开辟一次空间,所以需要将主要的代码都放在子函数中,对子函数进行递归
//递归实现归并排序 void _MergeSort(int* a, int begin, int end, int* tmp) { if (begin == end) return; int midi = (begin + end) / 2; _MergeSort(a, begin, midi, tmp); _MergeSort(a, midi + 1, end, tmp); int begin1 = begin, end1 = midi; int begin2 = midi + 1, end2 = end; int i = begin; while (begin1 <= end1 && begin2 <= end2) { if (a[begin1] < a[begin2]) { tmp[i++] = a[begin1++]; } else { tmp[i++] = a[begin2++]; } } while (begin1 <= end1) { tmp[i++] = a[begin1++]; } while (begin2 <= end2) { tmp[i++] = a[begin2++]; } memcpy(a + begin, tmp + begin, sizeof(int) * (end - begin + 1)); } void MergeSort(int* a, int n) { int* tmp = malloc(sizeof(int) * n); _MergeSort(a, 0, n - 1, tmp); free(tmp); }
通过非递归来实现归并排序,最难解决的是边界问题
(1)设定一个初始值为1的gap
(2)通过gap来分割子序列。每次分割出两个相邻的子序列进行归并,归并好一组就将其覆盖到原序列中
(3)重复步骤2直到第一轮归并结束
(4)gap乘2,重复步骤2~3,直到gap超过原序列的大小
对于边界问题,在分割子序列的时候可能会出现以下问题:
①两个子序列都越界
②只有第二个子序列越界
当相邻的两个子序列都越界时,我们就不对它们进行归并了,放在原序列中就好
当只有第二个子序列越界时,我们对越界的序列右侧进行修正即可
//非递归实现归并排序 void MergeSortNonR(int* a, int n) { int* tmp = malloc(sizeof(int) * n); int gap = 1; while (gap < n) { for (int i = 0; i < n; i += 2 * gap) { int begin1 = i, end1 = i + gap - 1; int begin2 = i + gap, end2 = i + 2 * gap - 1; int j = i; if (end1 >= n || begin2 >= n) { break; } if (end2 >= n) { end2 = n - 1; } while (begin1 <= end1 && begin2 <= end2) { if (a[begin1] < a[begin2]) { tmp[j++] = a[begin1++]; } else { tmp[j++] = a[begin2++]; } } while (begin1 <= end1) { tmp[j++] = a[begin1++]; } while (begin2 <= end2) { tmp[j++] = a[begin2++]; } memcpy(a + i, tmp + i, sizeof(int) * (end2 - i + 1)); } gap *= 2; } free(tmp); }
计数排序是一个不基于比较的排序算法,又被称为鸽巢原理,是对哈希直接定址法的变形应用。
其优势在于对一定范围内较集中的序列排序时,其时间复杂度低于任何一个基于比较的算法。
其劣势在于是一种用空间换时间的算法,依赖数据范围,只适用于范围较集中的整型数组。
核心思想:统计待排序序列中每种元素出现的次数,按照顺序和出现的次数依次放入原序列中
(1)首先遍历待排序序列找出最大值和最小值,算出序列元素的范围大小
(2)按照算出的范围开辟一块空间,用来存放统计出的元素个数
因为序列中元素的范围不一定从0开始,如果使用绝对映射(以元素的真实数值作为下标)就会浪费大量空间。当我们找出最大值和最小值后,将元素减去最小值就是它的相对位置
(3)遍历待排序序列,对每种元素出现的次数进行统计
(4)根据统计的结果,按照顺序放入原序列
void CountSort(int* a, int n) //计数排序 { int max = a[0], min = a[0]; for (int i = 0; i < n; i++) { if (a[i] > max) { max = a[i]; } if (a[i] < min) { min = a[i]; } } int range = max - min + 1; int* tmp = (int*)malloc(sizeof(int) * range); memset(tmp, 0, sizeof(int) * range); for (int i = 0; i < n; i++) { tmp[a[i] - min]++; } int k = 0; for (int i = 0; i < range; i++) { while (tmp[i]--) { a[k++] = i + min; } } }
既然写了这么多排序算法,不来比个赛多少有点可惜了
通过下面这段代码,我们来测试一下以上八种排序算法
void TestOP() { srand(time(0)); const int N = 100000; int* a1 = (int*)malloc(sizeof(int) * N); int* a2 = (int*)malloc(sizeof(int) * N); int* a3 = (int*)malloc(sizeof(int) * N); int* a4 = (int*)malloc(sizeof(int) * N); int* a5 = (int*)malloc(sizeof(int) * N); int* a6 = (int*)malloc(sizeof(int) * N); int* a7 = (int*)malloc(sizeof(int) * N); int* a8 = (int*)malloc(sizeof(int) * N); for (int i = 0; i < N; ++i) { a1[i] = rand(); a2[i] = a1[i]; a3[i] = a1[i]; a4[i] = a1[i]; a5[i] = a1[i]; a6[i] = a1[i]; a7[i] = a1[i]; a8[i] = a1[i]; } int begin1 = clock(); InsertSort(a1, N); int end1 = clock(); int begin2 = clock(); ShellSort(a2, N); int end2 = clock(); int begin3 = clock(); SelectSort(a3, N); int end3 = clock(); int begin4 = clock(); HeapSort(a4, N); int end4 = clock(); int begin5 = clock(); QuickSort(a5, 0, N - 1); int end5 = clock(); int begin6 = clock(); MergeSort(a6, N); int end6 = clock(); int begin7 = clock(); BubbleSort(a7, N); int end7 = clock(); int begin8 = clock(); CountSort(a8, N); int end8 = clock(); printf("InsertSort:%d\n", end1 - begin1); printf("ShellSort:%d\n", end2 - begin2); printf("SelectSort:%d\n", end3 - begin3); printf("HeapSort:%d\n", end4 - begin4); printf("QuickSort:%d\n", end5 - begin5); printf("MergeSort:%d\n", end6 - begin6); printf("BubbleSort:%d\n", end7 - begin7); printf("CountSort:%d\n", end8 - begin8); free(a1); free(a2); free(a3); free(a4); free(a5); free(a6); free(a7); free(a8); }
这是10万个数据的测试结果
可以显著看到时间复杂度为O(n2)的算法和O(n*logn)的算法之间差距有多大
最后,如果你对不同排序算法的动图有兴趣,可以前往排序(冒泡排序,选择排序,插入排序,归并排序,快速排序,计数排序,基数排序) - VisuAlgohttps://visualgo.net/zh/sorting
如果本文对你有帮助的话就点个赞吧(╹ڡ╹ )
完.