排序是一项非常常用的操作,你的应用程序在运行时,可能无时无刻不在进行排序操作。排序的算法有很多,但是对于大部分的算法都是串行执行的。当排序的元素很多时,若使用并行算法代替串行,显然可以更加有效的利用CPU,提高排序效率。但将串行算法修改为并行算法并非易事,甚至会极大的增加原有算法的复杂度。下面介绍几种相对简单的算法。
奇偶交换排序:分离数据相关性
在介绍奇偶交换排序前,首先来看一下冒泡排序。在这里,我们将数组从小到大排序:
1 public static int[] bubbleSort(int[] arr){ 2 for (int i = 0;i < arr.length - 1;i++){ 3 for (int j = 0;j < arr.length - 1 - i;j++){ 4 if (j+1 == arr.length-i){ 5 break; 6 } 7 if (arr[j] > arr[j+1]){ 8 int temp = arr[j]; 9 arr[j] = arr[j+1];10 arr[j+1] = temp;11 }12 }13 }14 return arr;15 }
在冒泡排序的交换过程中,由于每次交换的两个元素存在数据冲突,也就是对于每个元素,它既可能与前面的元素交换,也可能与后面的元素交换,因此很难直接改造成并行算法。如果能够解开这种数据的相关性,就可以比较容易的使用并行算法来实现类似的排序。奇偶交换排序就是基于这种思想的对于奇偶交换来说,它将排序过程分为两个阶段,奇交换和偶交换。对于奇交换来说,它总是比较奇数索引以及相邻的后续元素;偶交换总是比较偶数索引和其相邻的后续元素,并且奇交换和偶交换会成对出现,这样才能保证比较和交换涉及到数组中的每一个元素。
从上图可以看出,由于将整个比较交换独立分割为奇阶段和偶阶段。这就使得在每一个阶段内,所有的比较和交换都是没有数据相关性的。因此,每一次比较和交换都可以独立执行,也就可以并行化了。
下面是奇偶交换的串行实现:
1 public static int[] oddEvevSort(int[] arr){ 2 int exchFlag = 1,start = 0; 3 while (exchFlag == 1 || start == 1){ 4 exchFlag = 0; 5 for (int i = start;i < arr.length - 1;i += 2){ 6 if (arr[i] > arr[i+1]){ 7 int temp = arr[i]; 8 arr[i] = arr[i+1]; 9 arr[i+1] = temp;10 exchFlag = 1;11 }12 }13 if (start == 0){14 start = 1;15 }else {16 start = 0;17 }18 }19 return arr;20 }
上述代码中,exchFlag用来记录当前迭代是否发生了数据交换,而start变量用来表示是奇交换还是偶交换。初始时,start为0,表示进行偶交换,每次迭代结束后,切换start状态。如果上一次发生了数据交换,或者当前进行的是奇交换,循环就不会停止,直到程序不再发生交换,并且当前进行的是偶交换为止(表示奇偶交换已经成对出现)。
下面是奇偶交换的并行排序:
1 public class CurrentOddEven { 2 static int[] arr = {23,3,23,4,5,5,6,6,6453,678,68,9,9,79878,97,897897,98,78}; 3 static int exchFlag = 1; 4 static synchronized void setExchFlag(int v){ 5 exchFlag = v; 6 } 7 8 static synchronized int getExchFlag(){ 9 return exchFlag;10 }11 public static class OddEvenSortTask implements Runnable{12 int i;13 CountDownLatch latch;14 15 public OddEvenSortTask(int i,CountDownLatch latch){16 this.i = i;17 this.latch = latch;18 }19 20 @Override21 public void run() {22 if (arr[i] > arr[i+1]){23 int temp = arr[i];24 arr[i] = arr[i+1];25 arr[i+1] = temp;26 setExchFlag(1);27 }28 latch.countDown();29 }30 }31 32 public static void main(String[] args) throws InterruptedException {33 int start = 0;34 ExecutorService es = Executors.newCachedThreadPool();35 while (getExchFlag() == 1 || start == 1){36 setExchFlag(0);37 //偶数的数组长度,当start=1时,只有length/2-1 个线程38 CountDownLatch latch = new CountDownLatch(arr.length/2-(arr.length%2 == 0?start:0));39 for (int i = start;i < arr.length - 1;i += 2){40 es.submit(new OddEvenSortTask(i,latch));41 }42 //等待所有线程结束43 latch.await();44 if (start == 0){45 start = 1;46 }else {47 start = 0;48 }49 }50 for (int temp:arr){51 System.out.println(temp);52 }53 es.shutdown();54 }55 }
上述代码第11行,定义了奇偶排序的任务类。该任务的主要工作是进行数据的比较和交换(第22~26行)。并行排序的主体在main方法中,使用了countDownLatch来记录线程数量,对于每一次的迭代,使用单独的线程对每一次元素比较和交换操作,在下一次的迭代开始之前,必须等上一次的迭代必须完成。
希尔排序:改进的插入排序
插入排序也是一种很常见的排序算法。它的基本思想:一个未排序的数组(当然也可以是链表)可以分为两个部分,前半部分是已经排序的,后半部分是未排序的。在进行排序时,只需要在未排序的部分中选择一个元素,将其插入前面有序的数组中即可。最终,未排序的部分会越来越少,直到为0,那么排序就完成了。初始时,可以假设已排序部分就是第一个元素。
插入排序串行排序如下:
1 public static int[] insertSort(int[] arr){ 2 int length = arr.length; 3 int i,j,key; 4 for (i = 1;i < length;i++){ 5 //key为要准备插入的元素 6 key = arr[i]; 7 j = i - 1; 8 while (j >= 0 && arr[j] > key){ 9 arr[j+1] = arr[j];10 j--;11 }12 //找到合适的位置插入key13 arr[j+1] = key;14 }15 return arr;16 }
上述代码第6行,提取准备插入的元素(也就是未排序序列中的第一个元素)。接着,在已排序的序列中找到这个元素的插入位置(第8~10行),并进行插入(第13行)即可。
简单的插入排序是很难进行并行化的。因为这一次的数据插入依赖于上一次得到的有序序列,因此多个步骤之间无法并行。为此,我们可以对插入排序进行扩展,就是希尔排序。
希尔排序将整个数组根据间隔h分割为若干个数组。子数组相互穿插在一起,每一次排序时,分别对每一个子数组进行排序。如下图所示(借大神的图侵删):
从上图可以看出,每一组排序完成后,可以递减h的值,进行下轮更精细的排序,知道h=1,此时,等价于一次插入排序。
希尔排序的一个主要优点是,即使最小的一个元素在数组的末尾,由于每次元素的移动都以h为间隔进行,因此数组末尾的小元素可以在很少的交换次数下,就被置换到最接近元素最终位置的地方。
下面是希尔排序的串行实现:
1 public static int[] shellSort(int[] arr){ 2 //计算出最大的h值 3 int h = 1; 4 while (h <= arr.length/3){ 5 h = h*3 + 1; 6 } 7 while (h > 0){ 8 for (int i = h;i < arr.length;i++){ 9 if (arr[i] < arr[i - h]){10 int temp = arr[i];11 int j = i - h;12 while (j >= 0 && arr[j] > temp){13 arr[j + h] = arr[j];14 j -= h;15 }16 arr[j + h] = temp;17 }18 }19 //计算出下一个h值20 h = (h - 1)/3;21 }22 return arr;23 }
上述代码的4~6行,计算出一个合适的h值,接着进行正式的希尔排序。第8行代码的for循环进行间隔为h的插入排序,每次排序结束后,递减h的值(第20行),直到h=1,退化为插入排序。
由于希尔排序每次都针对不同的子数组进行排序,各个子数组之间是完全独立的,因此,是可以改写为并行程序的:
1 public class CurrentShellSort { 2 static int[] a = {2,3,1,45,53,3,55,4,65,765,7,7,89687,6,89,69,4354,89,99}; 3 static ExecutorService pool = Executors.newCachedThreadPool(); 4 5 public static class ShellSortTask implements Runnable { 6 7 int x = 0; 8 int h = 0; 9 CountDownLatch l;10 11 public ShellSortTask(int x, int h, CountDownLatch latch) {12 this.x = x;13 this.h = h;14 this.l = latch;15 }16 17 public void run() {18 int i, j, key;19 for (i = x + h; i < a.length; i = i + h) {20 if (a[i] < a[i - h]) {21 j = i - h;22 key = a[i];23 while (j >= 0 && a[j] > key) {24 a[j + h] = a[j];25 j -= h;26 }27 a[j + h] = key;28 }29 }30 l.countDown();31 }32 }33 34 public static void pShellSort(int[] arr) throws InterruptedException {35 // 计算出最大的n值36 int h = 1;37 CountDownLatch lathc = null;38 while (h <= arr.length / 3) {39 h = h * 3 + 1;40 }41 while (h > 0) {42 System.out.println("h=" + h);43 lathc = new CountDownLatch(h);44 for (int x = 0; x < h; x++) {45 pool.submit(new ShellSortTask(x, h, lathc));46 }47 lathc.await();48 System.out.println(Arrays.toString(arr));49 // 计算下一个h值50 h = (h - 1) / 3;51 }52 pool.shutdown();53 }54 //测试55 public static void main(String[] args) throws InterruptedException {56 pShellSort(a);57 }58 }
输出结果:
h=13[2, 3, 1, 45, 53, 3, 55, 4, 65, 765, 7, 7, 89687, 6, 89, 69, 4354, 89, 99]h=4[2, 3, 1, 4, 53, 3, 7, 7, 65, 6, 55, 45, 4354, 89, 89, 69, 89687, 765, 99]h=1[1, 2, 3, 3, 4, 6, 7, 7, 45, 53, 55, 65, 69, 89, 89, 99, 765, 4354, 89687]
参考:《Java高并发程序设计》 葛一鸣 郭超 编著: