Bài giảng Cấu trúc và dữ liệu giải thuật - Chương 6: Sắp xếp - Phạm Thanh An

ppt 35 trang ngocly 4360
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Cấu trúc và dữ liệu giải thuật - Chương 6: Sắp xếp - Phạm Thanh An", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pptbai_giang_cau_truc_va_du_lieu_giai_thuat_chuong_6_sap_xep_ph.ppt

Nội dung text: Bài giảng Cấu trúc và dữ liệu giải thuật - Chương 6: Sắp xếp - Phạm Thanh An

  1. Chương 6: Sắp xếp Ths. Phạm Thanh An Bộ môn Khoa học máy tính - Khoa CNTT Trường Đại học Ngân hàng TP.HCM LOGO
  2. Mục tiêu ❖Trình bày các thuật toán thông dụng cho việc sắp xếp trong (sắp xếp trên bộ nhớ trong - RAM) ❖Minh họa các thuật toán ❖Đánh giá thuật toán
  3. Tại sao cần phải sắp xếp dữ liệu ❖Chúng ta cần có trật tự yêu cầu nào đó trên tập dữ liệu ❖Chúng ta cần thực hiện các phép tìm kiếm nhị phân, chỉ mục một CSDL ❖Là bước khởi đầu cho nhiều giải thuật trên tập dữ liệu
  4. SẮP XẾP (SORTING) ❖Ví dụ 1: ▪ Sắp xếp một danh sách sinh viên theo vần A, B, C ▪ Sắp xếp theo thứ tự điểm tổng kết từ cao đến thấp để xét học bổng sinh viên
  5. SẮP XẾP (SORTING) ❖Ví dụ 2: ▪ Sắp xếp một danh sách cán bộ theo mức thu nhập ▪ Sắp xếp danh sách các các em học sinh theo trật tự xếp hàng: thấp đứng trước, cao đứng sau
  6. SẮP XẾP (SORTING) ❖Định nghĩa ▪ Sắp xếp là quá trình tổ chức lại tập dữ liệu theo một trật tự tăng dần hay giảm dần ❖Hai mô hình sắp xếp ▪ Sắp xếp trong (internal), các phần tử cần sắp xếp được lưu sẵn trong RAM ▪ Sắp xếp ngoài (external), một số các phần tử cần sắp xếp lưu trong RAM, còn lại được lưu ở bộ nhớ ngoài
  7. Các phương pháp sắp xếp ❖Các thuật toán cơ bản ▪ Thuật toán “Selection sort” ▪ Thuật toán “Insertion sort” ▪ Thuật toán “Buble sort” ▪ Thuật toán “Heap sort” ▪ Thuật toán “Quick sort” ❖Để tiện trình bày, giả sử sắp xếp các phần tử trên mảng A, N phần tử : A [0], A [1], A [2], , A [N-1].
  8. Sắp xếp lựa chọn (selection sort) ❖Ý tưởng: ▪ Giải thuật “selection sort” sắp xếp một danh sách các giá trị bằng cách lặp lại việc đặt một giá trị cụ thể vào đúng vị trí thích hợp cho nó trong dãy sắp xếp ▪ Nói cách khác, với mỗi vị trí trong danh sách, giải thuật đi tìm giá trị phù hợp cho vị trí đó.
  9. Sắp xếp lựa chọn (Selection sort) ❖Ví dụ: sắp xếp một dãy các số nguyên theo trật tự tăng dần, ta làm như sau: ▪ Ở bước thứ i, chọn phần tử nhỏ nhất trong dãy a[i], a[i+1], , a[n] ▪ Đổi chỗ phần tử này với phần tử a[i]
  10. Sắp xếp lựa chọn (Selection sort) 44 55 12 42 94 18 06 67 44 55 12 42 94 18 06 67 06 55 12 42 94 18 44 67 06 12 55 42 94 18 44 67 06 12 18 42 94 55 44 67 06 12 18 42 94 55 44 67 06 12 18 42 44 55 94 67 06 12 18 42 44 55 94 67 06 12 18 42 44 55 67 94
  11. Sắp xếp lựa chọn (Selection sort) ❖Giải thuật void SelectionSorting(int a[], int n) { int tmp; for (int i=0;i a[j]) in_index = j; } tmp=a[min_index]; a[min_index] = i; a[i]=tmp; } } }
  12. Sắp xếp lựa chọn (Selection sort) ❖Độ phức tạp tính toán ▪ Ở bước thứ i, có (n-i) lần so sánh, với i=1 n- 1 (n-1) + (n-2) + + 1 = n(n-1)/2 = O(n2) ▪ Thời gian thực hiện giải thuật T(n) ~ O(n2)
  13. Sắp xếp chèn (Insert sort) ❖Ý tưởng: Dựa theo ý tưởng của người chơi bài ▪ Giả sử ở bước thứ i các phần tử đã được sắp xếp theo thứ tự khóa ki1, ki2, , kii-1 ▪ Xét phần tử thứ i có khóa kii, ta lần lượt so sánh với các phần tử đã được sắp sẵn, để tìm vị trí chèn thích hợp
  14. Sắp xếp chèn (Insert sort) ❖ Ban đầu xem như phần sắp xếp chỉ có 1 phần tử 44 44 55 44 55 12 12 44 55 42 12 42 44 55 94 12 42 44 55 94 18 12 18 42 44 55 94 06 06 12 18 42 44 55 94 67 06 12 18 42 44 55 67 94
  15. Sắp xếp chèn (Insert sort) ❖Ví dụ Dãy ban đầu 34 8 64 51 32 21 Moved Sau i=1 8 34 64 51 32 21 1 Sau i=2 8 34 64 51 32 21 0 Sau i=3 8 34 51 64 32 21 1 Sau i=4 8 32 34 51 64 21 3 Sau i=5 8 21 32 34 51 64 4
  16. Sắp xếp chèn (Insert sort) ▪ Giải thuật void InsertionSorting(int a[], int n){ int x,i,j; for (i=1;i =0){ a[j+1]=a[j]; j=j-1; } a[j+1]=x; } }
  17. Sắp xếp chèn (Insert sort) ❖ Độ phức tạp tính toán ▪ Ở bước thứ i, có tối đa i-1, tối thiểu 1 phép so sánh ▪ Thời gian thực hiện giải thuật T(n) ~ O(n2) ▪ Trường hợp xấu nhất có: ▪ 1 + 2 + 3 + + (n-1) = n(n-1)/2 = O(n2) phép so sánh và dịch chuyển ▪ Trường hợp tốt nhất (mảng đã có thứ tự tăng dần): O(n) phép so sánh và 0 phép dịch chuyển
  18. Sắp xếp nổi bọt (Buble Sort) ❖Ý tưởng: ở bước i, kể từ phần tử thứ i ▪ So sánh hai phần tử kề nhau, nếu khóa của phần tử trước lớn hơn khóa của phần tử sau, thì đổi chỗ cho nhau. ▪ Cuối cùng, ta được phần tử có khóa lớn nhất đặt tại vị trí n-i+1
  19. Sắp xếp nổi bọt (Buble Sort) 1 1 23 2 56 9 8 10 100 2 1 2 23 56 9 8 10 100 3 1 2 23 9 56 8 10 100 4 1 2 23 9 8 56 10 100 5 1 2 23 9 8 10 56 100 Kết thúc vòng đầu tiên 1 2 23 9 8 10 56 100 1 1 2 9 23 8 10 56 100 2 1 2 9 8 23 10 56 100 3 1 2 9 8 10 23 56 100 Kết thúc vòng 2
  20. Sắp xếp nổi bọt (Buble Sort) ▪ Giải thuật void BubleSorting(int a[], int n){ int tmp; for (int i=0;i a[j+1]){ tmp=a[j+1]; a[j+1]=a[j]; a[j]=tmp; } } } }
  21. Sắp xếp nổi bọt (Buble Sort) ❖Độ phức tạp tính toán ▪ Ở bước thứ i, có n-i phép so sánh ▪ Thời gian thực hiện giải thuật T(n) ~ O(n2)
  22. Sắp xếp nhanh (Quick sort) ❖ Ý tưởng ▪ Xét một dãy n phần tử a1,a2, ,an ▪ (1) chọn phần tử x=a[(n+1)div 2] làm khóa ▪ (2) đi từ hai đầu của dãy, nếu gặp một cặp a[i]≥x≥a[j] thì hoán vị hai phần tử này ▪ (3) tăng i=i+1, giảm j=j-1 ▪ (4) lặp lại (2) cho đến khi i>j (kết quả thu được phân đoạn AxB) ▪ (5) lặp lại (1)-(4) với hai phân đoạn A và B ▪ Kết thúc khi tất cả các phân đoạn thu được có chiều dài là 1
  23. Sắp xếp nhanh (Quick sort) 4406 5518 12 42 94 1855 0644 67 06 1812 1218 42 9444 55 4494 67 06 12 18 42 44 55 9467 6794
  24. Sắp xếp nhanh (Quick sort) ▪ Giải thuật void QuickSort(int a[], int l,int r){ int tmp;int i=l;int j=r;int x=a[(l+r)/2]; do { while (a[i] x) j ; if (i i) QuickSort(a,i,r); }
  25. Sắp xếp nhanh (Quick sort) ❖Nhận xét ▪ Nếu chọn phần tử khóa là nhỏ nhất (lớn nhất) có thể dẫn đến tình huống xấu nhất của phương pháp ▪ Khi số lượng phần tử thấp, nên dùng phương pháp sắp xếp đơn giản
  26. Sắp xếp nhanh (Quick sort) ❖ Đánh giá ▪ T(n) thời gian thực hiện QS (n phần tử) ▪ P(n) thời gian phân mảng n phần tử thành hai đoạn (1,j) và (i,r) ▪ T(n)=P(n)+T(1 j)+T(i r), P(n)=Cn ▪ Trường hợp tốt nhất, mỗi bước phân thành hai đoạn có chiều dài bằng nhau • T(n) = 2T(n/2)+Cn ~ O(nlogn) ▪ Trường hợp xấu nhất, mỗi bước phân mảng r thành hai đoạn có chiều dài r-1 và 1 • T(n) = Cn+T(n-1)+T(1) ~ O(n2)
  27. Heap sort ❖Định nghĩa ▪ Dãy h1, ,hn gọi là một HEAP, nếu thỏa mãn • hi>h2i+1 • hi>h2i+2 ▪ Chú ý • Các phần tử có chỉ số [n/2], ,n-1 là nút lá • HEAP có n phần tử thì có [n/2] nút trong
  28. Heap sort ❖Heap sort 94 87 74 65 58 42 7 36 11 23
  29. Heap sort ❖Heap sort ▪ Xét dãy 43,23,71,11,65,58,94,36,99,87 43 23 71 99 11 65 58 94 87 94 36 99 87 36 65 58 71 23 11 43
  30. Heap sort ❖Phương pháp tạo HEAP từ đáy lên ❖Việc tạo HEAP bắt đầu từ các nút trong (nút số 0 đến nút số [n/2]-1) 43 23 71 11 65 58 94 36 99 87
  31. Heap sort ❖Heap sort 0 43 1 2 99 94 3 4 5 6 36 87 58 71 7 8 9 23 11 65 0 99 1 2 87 94 3 4 5 6 36 65 58 71 7 8 9 23 311 43
  32. Heap sort ❖ Giải thuật void SetupHeap(int a[], int k, int n) // điều chỉnh phần tử thứ k { int x=a[k]; while (k a[j]) break; a[k]=a[j];k=j; } a[k]=x; } void MakeHeap(int a[], int n){ // tạo đống for (int i=n/2-1;i>=0;i ) SetupHeap(a, i, n); }
  33. Heap sort ❖Giải thuật void Heapsort() { int tmp; makeheap(a,n) for (int i=n-1;i>0;i ){ tmp=a[0];a[0]=a[i];a[i]=tmp; setupHeap(a,0,i); } }
  34. Heap sort ❖Heap sort ▪ Nhận xét • Thời gian thực hiện SetupHeap là O(logn) • Thời gian thực hiện MakeHeap là O(nlogn) • Thời gian thực hiện HeapSort là O(nlogn)