Phương pháp bán giám sát trong phân loại lớp phủ trên ảnh vệ tinh sử dụng thuật toán Mountain

pdf 12 trang ngocly 1370
Bạn đang xem tài liệu "Phương pháp bán giám sát trong phân loại lớp phủ trên ảnh vệ tinh sử dụng thuật toán Mountain", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfphuong_phap_ban_giam_sat_trong_phan_loai_lop_phu_tren_anh_ve.pdf

Nội dung text: Phương pháp bán giám sát trong phân loại lớp phủ trên ảnh vệ tinh sử dụng thuật toán Mountain

  1. TẠP CHÍ KHOA HỌC ĐHSP TPHCM Số 3(81) năm 2016 ___ PHƯƠNG PHÁP BÁN GIÁM SÁT TRONG PHÂN LOẠI LỚP PHỦ TRÊN ẢNH VỆ TINH SỬ DỤNG THUẬT TOÁN MOUNTAIN MAI ĐÌNH SINH*, TRỊNH LÊ HÙNG , ĐÀO KHÁNH HOÀI TÓM TẮT Ngày nay có nhiều thuật toán phân loại ảnh vệ tinh như K – Means, ISODATA, hình hộp, khoảng cách ngắn nhất Tuy nhiên, hầu hết các thuật toán này đều dựa vào thuộc tính quan trọng của mỗi điểm ảnh với lân cận của nó là sự giống nhau và khác nhau về màu sắc mà không quan tâm đến các thuộc tính khác của các cụm như mật độ, hình dáng cụm Trong bài báo này, chúng tôi đề xuất phương pháp phân loại lớp phủ dựa trên thuật toán Mountain sử dụng tư liệu ảnh vệ tinh quang học Landsat. Kết quả nhận được cho thấy, chất lượng các cụm tốt hơn khi so với kết quả phân loại dựa trên một số thuật toán khác như K-Means và ISODATA. Từ khóa: phân loại, bán giám sát, ảnh vệ tinh, Landsat, Mountain, NDVI. ABSTRACT Semi – supervised method for land cover classification of remotely sensed image using Mountain algorithm There have been many classification algorithms for remotely sensed images, such as K – Means, ISODATA, parallelepiped and minimum distance. However, most of these algorithms are based on a key attribute of each pixel with its neighbors which shows the similarities and difference in color without regarding to other properties such as the density of clusters, clustered shape. In this study, we propose a new method for land cover classification based on Mountain algorithm using Landsat optical images. The obtained results show a better quality in clusters when compared with the classified results based on other algorithms such as K-Means and ISODATA. Keywords: classification, semi-supervised, remote sensed image, Landsat, Mountain, NDVI. 1. Mở đầu Ảnh viễn thám là hình ảnh chụp bề mặt Trái Đất từ các vệ tinh nhân tạo nhằm phục vụ giải quyết các bài toán cụ thể. Trong thực tế, trên ảnh vệ tinh cần phân lập ra những nhóm điểm ảnh gần tương đồng về giá trị độ xám và đặc trưng phổ. Phân loại ảnh là một khâu hết sức quan trọng trong xử lí ảnh vệ tinh. Kết quả phân loại ảnh vệ tinh có thể được sử dụng phục vụ các mục đích khác nhau, từ nghiên cứu tài nguyên * ThS, Học viện Kĩ thuật Quân sự, Hà Nội; Email: maidinhsinh@gmail.com TS, Học viện Kĩ thuật Quân sự, Hà Nội 132
  2. TẠP CHÍ KHOA HỌC ĐHSP TPHCM Mai Đình Sinh và tgk ___ thiên nhiên, giám sát môi trường đến quốc phòng – an ninh [1-9]. Mặc dù vậy, do đặc điểm ảnh vệ tinh thường có nhiều kênh, dung lượng ảnh lớn, lại chịu ảnh hưởng bởi điều kiện thời tiết và thiết bị đo nên việc phân loại các đối tượng trên ảnh là một bài toán phức tạp. [1-3] Hiện nay, có nhiều phương pháp phân loại ảnh vệ tinh như phương pháp phân ngưỡng (manual thresholds), phương pháp phân loại tự động không giám sát (unsupervised classification) [3], phương pháp phân loại tự động có giám sát (supervised classification), phương pháp sử dụng logic mờ [8] Trong các phương pháp phân loại này thường sử dụng một số thuật toán phổ biến như khoảng cách ngắn nhất (minimum distance), xác suất cực đại (maximum likelihood), K – Means, C – Means, ISODATA [5]. Mỗi phương pháp phân loại ảnh đều sử dụng các thuật toán nhất định, tuy nhiên các thuật toán này thường bỏ qua một số thuộc tính quan trọng của các cụm như mật độ điểm ảnh tại các trọng tâm cụm, hình dáng cụm Điều này ảnh hưởng rất lớn đến độ chính xác của kết quả phân loại. Để giải quyết vấn đề trên, trong bài báo đề xuất phương pháp phân loại dựa trên thuật toán Mountain, thử nghiệm với tư liệu ảnh vệ tinh quang học độ phân giải trung bình Landsat 8 OLI. Ảnh Khởi Ảnh vệ tinh tạo Phân Tổng kết trọng loại hợp quả tâm Hình 1. Mô hình bài toán phân loại ảnh 2. Cơ sở lí thuyết và phương pháp đề xuất 2.1. Thuật toán Mountain Phân cụm Mountain [6] tìm trọng tâm cụm dựa trên mật độ đo gọi là hàm Mountain xác định theo công thức sau: 2 n x x j (1) h( x )  exp( 2 ) j 1 2 trong đó: h(x) là chiều cao của hàm Mountain tại một điểm x; xj là dữ liệu điểm ảnh thứ j và δ là một hằng số ứng dụng cụ thể. 133
  3. TẠP CHÍ KHOA HỌC ĐHSP TPHCM Số 3(81) năm 2016 ___ Công thức (1) cho biết kết quả đo tại một điểm x bị ảnh hưởng bởi tất cả các điểm xj trong tập dữ liệu. Phép đo này tỉ lệ nghịch với khoảng cách từng điểm xj với điểm x đang xem xét. Hằng số δ xác định chiều cao cũng như thông số kết quả hàm Mountain. Trọng tâm cụm thứ nhất c1 xác định bằng cách chọn điểm với giá trị h(x) lớn nhất. Trọng tâm cụm tiếp theo loại trừ ảnh hưởng của cụm c1 nên tính lại hàm h(x) thay bằng hnew(x). Hàm hnew(x) tính bằng h(x) trừ đi tỉ lệ trọng tâm hàm mật độ Gaussian tại c1: 2 n c x 1 j (2) hnew () x h () x h ()* c1  exp( 2 ) j 1 2 Với β là hằng số xác định chiều cao tương ứng với tâm cụm tiếp theo, trong đó chiều cao của các cụm sau luôn lớn hơn các cụm trước đó. Chú ý rằng hàm hnew(x) giảm tới 0 tại x=c1. Trọng tâm cụm thứ 2 chọn điểm có hnew(x) lớn nhất. Quá trình tiếp tục cho đến khi đủ số lượng trọng tâm cụm đạt được. 2.2. Phương pháp đề xuất Để có thể áp dụng thuật toán Mountain cho ảnh vệ tinh đa phổ với k kênh, dữ liệu ảnh được chuyển thành một file vector X. Mỗi thành phần của X được biểu diễn bởi các giá trị trên các kênh phổ từ 1 đến k. Đặt dữ liệu thứ j của vector X là: xj { x j } { x j1 , x j 2 , , x jk },  j 1, n (3) Không mất tính tổng quát, dữ liệu các điểm ảnh được chuẩn hóa theo công thức sau: xjp ( x jp x pmin )/( x p max x p min ),  j 1, ; n p 1, , k (4) xpmin min{ x jp },  j 1, , n ; p 1, , k trong đó: xpmax m ax{ x jp },  j 1, , n ; p 1, , k Do tính độc lập của các điểm ảnh, mỗi điểm ảnh x jp (được biểu diễn bằng k thành phần) đều có khả năng trở thành trọng tâm của các cụm. Nếu coi mỗi điểm ảnh x jp đều là một trọng tâm cụm tiềm năng, độ đo tiềm năng của dữ liệu điểm ảnh x jp được định nghĩa là một hàm khoảng cách giữa x jp và tất cả các điểm ảnh khác trên ảnh: n d2 (,) x x jp rp (5) Hr ,1  exp (2 ),  r 1, , n j 1 d1 Trong đó, Hr,1 là giá trị biểu thị khả năng trở thành tâm cụm của một điểm ảnh. Giá trị này càng lớn thì khả năng điểm ảnh đang xét trở thành tâm cụm càng cao và ngược lại, giá trị này nhỏ thì khả năng điểm ảnh đang xét là trọng tâm cụm càng thấp. 134
  4. TẠP CHÍ KHOA HỌC ĐHSP TPHCM Mai Đình Sinh và tgk ___ d1 là một hằng số dương, xác định vùng lân cận của dữ liệu điểm ảnh. Các điểm ảnh nằm ngoài bán kính d1 ảnh hưởng rất ít tới giá trị trọng tâm cụm tiềm năng. Hiển nhiên, giá trị trọng tâm cụm tiềm năng của dữ liệu sẽ xấp xỉ với mật độ của dữ liệu điểm ảnh trong vùng lân cận của tập dữ liệu. Giá trị tiềm năng của mỗi dữ liệu điểm ảnh càng cao thì khả năng điểm ảnh đó là trọng tâm cụm càng cao. Trọng tâm cụm đầu tiên được chọn chính là giá trị cao nhất của Hr,1: c1p x 1p  H1 max(H r ,1 ), r 1, , n (6) Để chọn trọng tâm của cụm thứ 2, giá trị tiềm năng của mỗi dữ liệu điểm ảnh được xét lại để giảm sự ảnh hưởng của hàm Mountain xung quanh trọng tâm cụm thứ nhất: n d2 (,) c x 1p rp (7) Hr,2 H r,1 H 1 * exp (2 ),  r 1, , n j 1 d2 Trong đó d2 là một hằng số dương, xác định vùng lân cận của dữ liệu điểm ảnh. Theo công thức (7), các dữ liệu điểm ảnh gần với trọng tâm cụm đầu tiên sẽ giảm mạnh giá trị tiềm năng nên không có khả năng được chọn là trọng tâm cụm tiếp theo. Với việc xét lại giá trị tiềm năng của mỗi dữ liệu điểm ảnh, trọng tâm cụm thứ hai được chọn chính là giá trị cao nhất của Hr,1: c2p x 2p  H 2 max(H r ,2 ), r 1, , n (8) Tương tự, lựa chọn trọng tâm cụm thứ m, sau đó xem xét lại giá trị tiềm năng của mỗi dữ liệu ảnh: n d2 (,) c x (m 1) p rp (9) Hr, m H r , m 1 H m 1 * exp( 2 ),  r 1, , n j 1 d2 Chọn trọng tâm cụm thứ m có Hr,m lớn nhất: cmp x mp  H m max(H r, m ), r 1, , n (10) Để kết thúc quá trình phân cụm, sử dụng tiêu chuẩn sau: H m (11) H1 Với α là một phân số nhỏ [10] – [11] được lựa chọn trong khoảng (0;1). Giá trị của α ảnh hưởng đến kết quả của bài toán, khi α bé thì chọn được nhiều trọng tâm cụm, và ngược lại khi α lớn, số lượng trọng tâm cụm chọn được sẽ ít. Rất khó để chọn một giá trị α thỏa mãn mọi trường hợp, do vậy cần phải có sự thử nghiệm với nhiều giá trị khác nhau của α, d1 và d2 để lựa chọn giá trị có kết quả tốt nhất. Khi không thỏa mãn tiêu chuẩn (11), thuật toán sẽ dừng lại và tùy từng trường hợp cụ thể để lựa chọn số lượng tâm cụm cho phù hợp. 135
  5. TẠP CHÍ KHOA HỌC ĐHSP TPHCM Số 3(81) năm 2016 ___ Sau khi có các trọng tâm cụm, tiến hành phân cụm dựa trên các trọng tâm cụm ở trên. Để gán các cụm này về các lớp tương ứng với các loại hình lớp phủ trên ảnh vệ tinh, trong nghiên cứu này sử dụng chỉ số khác biệt thực vật NDVI (Normalized Difference Vegetation Index) [7, 14]. Chỉ số NDVI được xác định dựa trên sự phản xạ khác nhau của thực vật ở dải sóng đỏ và cận hồng ngoại, thể hiện qua công thức sau [14]: NIR RED NDVI (12) NIR RED Trong đó, NIR và RED tương ứng là giá trị phản xạ phổ tại kênh cận hồng ngoại và kênh đỏ ảnh vệ tinh. Đối với ảnh vệ tinh Landsat 5 TM và Landsat 7 ETM+, các kênh này tương ứng là kênh 4 và kênh 3, trong khi với ảnh Landsat 8 OLI là các kênh 5 và 4. [15] Giá trị chỉ số NDVI nằm trong khoảng từ -1 đến 1, trong đó NDVI thấp thể hiện những khu vực có độ che phủ thực vật thấp. Giá trị NDVI cao đại diện cho những khu vực có độ che phủ thực vật cao, còn giá trị NDVI âm thể hiện các khu vực đất ẩm và mặt nước. [14] Như vậy, thuật toán đề xuất có thể tóm tắt qua các bước sau: Bước 1. Chuẩn hóa dữ liệu a) Đọc ảnh vệ tinh Landsat vào mảng X theo công thức (3); b) Chuẩn hóa mảng X theo công thức (4). Bước 2. Tìm các trọng tâm cụm a) Tính toán giá trị biểu thị khả năng trở thành tâm cụm Hr của tất cả các điểm ảnh theo công thức (5); b) Tìm điểm ảnh có Hr lớn nhất theo công thức (6) và gán chúng là tâm cụm, sau đó loại chúng ra khỏi tập ứng viên tâm cụm tiềm năng; c) Cập nhật lại giá trị Hr của các điểm ảnh còn lại theo công thức (7); d) Lặp lại các bước (8), (9) và (10) cho đến khi đủ số lượng tâm cụm hoặc thỏa mãn điều kiện dừng (11). Bước 3. Phân cụm ảnh X dựa trên các trọng tâm cụm tìm được ở trên. Bước 4. Lấy dữ liệu mẫu trên ảnh và tính toán ngưỡng giá trị NDVI theo các lớp phủ. Bước 5. Gán các cụm về các lớp tương ứng với các lớp phủ trên ảnh vệ tinh Landsat dựa trên chỉ số thực vật NDVI. Bước 6. Hiển thị kết quả bằng cách gán màu sắc và chồng ghép các lớp sau khi phân loại. 136
  6. TẠP CHÍ KHOA HỌC ĐHSP TPHCM Mai Đình Sinh và tgk ___ 3. Kết quả thực nghiệm Để xử lí và phân loại lớp phủ trên ảnh vệ tinh, nhóm tác giả sử dụng ngôn ngữ lập trình C++. Đây là ngôn ngữ mạnh và rất hiệu quả trong xử lí ảnh số, đặc biệt đối với những ảnh có dung lượng lớn như ảnh vệ tinh. Địa bàn thử nghiệm gồm 2 khu vực với đặc trưng lớp phủ khác nhau: Khu vực miền núi (huyện Bảo Lâm, tỉnh Lâm Đồng) và khu vực đồng bằng, đô thị (thành phố Thái Nguyên, tỉnh Thái Nguyên). Thử nghiệm 1. Trong thử nghiệm này, nhóm tác giả sử dụng tư liệu ảnh vệ tinh Landsat 8 OLI chụp ngày 14-02-2014 khu vực huyện Bảo Lâm, tỉnh Lâm Đồng – Hình 2a). Tư liệu ảnh Landsat được tiền xử lí và xác định giá trị phản xa phổ [16]. Ở bước tiếp theo, tính toán chỉ số thực vật NDVI theo công thức (12). Kết quả xác định chỉ số NDVI được thể hiện trên Hình 2b. a) b) Hình 2. Ảnh Landsat 8 OLI ngày 14-02-2014 khu vực Bảo Lâm, Lâm Đồng (a) và ảnh chỉ số thực vật NDVI (b) Để xác định ngưỡng giá trị chỉ số NDVI đối với các loại hình lớp phủ, trong bài báo tiến hành lấy các dữ liệu mẫu đối với từng đối tượng, được trích xuất trực tiếp trên ảnh NDVI. Số lượng mẫu tùy thuộc từng bài toán cụ thể cũng như tùy từng loại hình lớp phủ. Trong nghiên cứu này, thử nghiệm phân loại với 6 đối tượng lớp phủ bao gồm: sông ngòi, ao, hồ (lớp 1); đất trống, đất xây dựng (lớp 2); đồng cỏ, thực vật thưa (lớp 3); cây gỗ thấp (lớp 4); rừng trồng (lớp 5) và thực vật dày, cây lâu năm (lớp 6). Các tham số thực nghiệm được lựa chọn với d1 = 0,15 và d2 = 1,5*d1, điều kiện dừng hiệu quả là 0,01<α<0,30. 137
  7. TẠP CHÍ KHOA HỌC ĐHSP TPHCM Số 3(81) năm 2016 ___ Kết quả xác định ngưỡng giá trị NDVI tương ứng với các loại đối tượng lớp phủ khu vực huyện Bảo Lâm (Lâm Đồng) bằng thuật toán Mountain được thể hiện trong Bảng 1 như sau: Bảng 1. Phân lớp các loại hình lớp phủ dựa trên chỉ số NDVI STT Tên đối tượng Giá trị NDVI Ghi chú 1 Sông ngòi, ao hồ -1,0 < NDVI < 0,0218 2 Đất trống, đất xây dựng 0,0219 < NDVI < 0,2135 3 Đồng cỏ, thực vật thưa 0,2136 < NDVI < 0,3082 4 Cây gỗ thấp 0,3083 < NDVI < 0,4135 5 Rừng trồng 0,4136 < NDVI <0,6733 6 Thực vật dày, cây lâu năm 0,6734 < NDVI < 1,0 Kết quả phân loại lớp phủ khu vực huyện Bảo Lâm (Lâm Đồng) bằng thuật toán K – Means, ISODATA và Mountain được thể hiện trên Hình 3(a-c) và Bảng 2. Có thể nhận thấy, khi phân loại bằng thuật toán ISODATA và K – Means, một số lớp đã bị gán nhầm vào lớp khác, đặc biệt là đối với đối tượng nước (Hình 3a, 3b). Ngoài ra, đối tượng đất trống, đất xây dựng hầu như không thể phân loại hiệu quả bằng các thuật toán này. Những hạn chế này đã được khắc phục khi sử dụng phương pháp dựa trên thuật toán Mountain (Hình 3c). (a) (b) (c) Hình 3. Kết quả phân loại lớp phủ khu vực huyện Bảo Lâm sử dụng thuật toán K – Means (a), ISODATA (b) và thuật toán Mountain (c) 138
  8. TẠP CHÍ KHOA HỌC ĐHSP TPHCM Mai Đình Sinh và tgk ___ Bảng 2. Số liệu diện tích các loại lớp phủ khu vực huyện Bảo Lâm (%) sau khi phân loại STT Loại đối tượng K-Means Iso-data Mountain 1 Sông ngòi, ao hồ 6,671 % 4,408 % 4,073 % 2 Đất trống, đất xây dựng 8,980 % 8,754 % 12,601 % 3 Đồng cỏ, thực vật thưa 15,253 % 15,390 % 17,420 % 4 Cây gỗ thấp 19,069 % 22,330 % 16,001 % 5 Rừng trồng 26,492 % 28,653 % 25,841 % 6 Thực vật dày, cây lâu năm 23,536 % 20,465 % 24,063 % Để so sánh độ chính xác kết quả phân loại dựa trên thuật toán Mountain, nhóm nghiên cứu đã so sánh với kết quả phân loại sử dụng thuật toán K – Means và ISODATA. Chỉ số đánh giá độ chính xác được lựa chọn bao gồm chỉ số DB-I (Davies Bouldin index) [12] và Kappa index (Bảng 3). Lưu ý rằng, giá trị chỉ số DB-I càng nhỏ thì chất lượng phân loại càng tốt, trong khi đó giá trị chỉ số Kappa càng lớn thể hiện độ chính xác càng cao. Bảng 3 cho thấy, giá trị chỉ số DB-I khi phân loại bằng thuật toán Mountain là 2,1974, trong khi phân loại với thuật toán K – Means và ISODATA, giá trị chỉ số này tương ứng là 5,2312 và 3,7612. Tương tự, với chỉ số Kappa, phương pháp đề xuất đạt giá trị 0,6732 so với 0,4256 và 0,5721 khi phân loại bằng thuật toán K – Means và ISODATA. Bảng 3. So sánh độ chính xác của kết quả phân loại với các thuật toán K – Means và ISODATA Phương pháp STT K - Means ISODATA Mountain Chỉ số đánh giá 1 DB-I 5,3562 3,5427 2,2792 2 Kappa 0,4561 0,5872 0,6698 Thử nghiệm 2. Trong thử nghiệm này, nhóm tác giả sử dụng tư liệu ảnh vệ tinh Landsat 5 TM chụp ngày 08-11-2010 khu vực thành phố Thái Nguyên (Hình 4a). Kết quả xác định chỉ số thực vật NDVI được trình bày trên Hình 4b. Các đối tượng lớp phủ được phân loại bao gồm 6 lớp: sông ngòi, ao, hồ (lớp 1); đất trống, đất xây dựng (lớp 2); đồng cỏ, thực vật thưa (lớp 3); cây gỗ thấp (lớp 4); rừng trồng (lớp 5) và thực vật dày, cây lâu năm (lớp 6). Thuật toán Mountain được sử dụng để xác định ngưỡng giá trị chỉ số thực vật NDVI đối với 6 lớp trên. Kết quả xác định ngưỡng giá trị NDVI tương ứng với các loại đối tượng lớp phủ khu vực thành phố Thái Nguyên được thể hiện trong Bảng 5. 139
  9. TẠP CHÍ KHOA HỌC ĐHSP TPHCM Số 3(81) năm 2016 ___ a) b) Hình 4. Kết quả xác định chỉ số thực vật NDVI đối với ảnh vệ tinh Landsat khu vực huyện Bảo Lâm (a) và thành phố Thái Nguyên (b) Bảng 4. Phân lớp các loại hình lớp phủ dựa trên chỉ số NDVI STT Tên đối tượng Giá trị NDVI Ghi chú 1 Sông ngòi, ao hồ -1,0 < NDVI < 0,0158 2 Đất trống, đất xây dựng 0,0159 < NDVI < 0,2071 3 Đồng cỏ, thực vật thưa 0,2072 < NDVI < 0,3367 4 Cây gỗ thấp 0,3368 < NDVI < 0,5281 5 Rừng trồng 0,5282 < NDVI <0,6864 6 Thực vật dày, cây lâu năm 0,6865 < NDVI < 1,0 Kết quả phân loại lớp phủ đối với ảnh vệ tinh Landsat khu vực thành phố Thái Nguyên được trình bày trên Hình 6(a-c) và Bảng 5. Có thể nhận thấy, khi sử dụng thuật toán K – Means và ISODATA, một số đối tượng như sông ngòi, ao, hồ (lớp 1); đất trống, đất xây dựng (lớp 3) hầu như không thể phân loại được, trong đó phần lớn diện tích khu vực đô thị Thái Nguyên bị lẫn với đối tượng nước (Hình 6a, 6b). Những hạn chế này cũng được khắc phục hiệu quả khi phân loại bằng thuật toán Mountain (Hình 6c). 140
  10. TẠP CHÍ KHOA HỌC ĐHSP TPHCM Mai Đình Sinh và tgk ___ a) b) c) Hình 6. Kết quả phân loại lớp phủ sử dụng thuật toán K – Means (a), ISODATA (b), thuật toán Moutain (c) đối với ảnh Landsat 5 TM khu vực thành phố Thái Nguyên. Bảng 4. Số liệu diện tích các loại lớp phủ khu vực huyện Bảo Lâm (%) sau khi phân loại STT Loại đối tượng K-Means Iso-data Mountain 1 Sông ngòi, ao hồ 11,220% 7,076% 4,486% 2 Đất trống, đất xây dựng 8,928% 9,446% 11,518% 3 Đồng cỏ, thực vật thưa 17,630% 18,666% 19,702% 4 Cây gỗ thấp 22,214% 24,286% 25,840% 5 Rừng trồng 20,264% 21,818% 24,409% 6 Thực vật dày, cây lâu năm 19,743% 18,707% 14,045% 141
  11. TẠP CHÍ KHOA HỌC ĐHSP TPHCM Số 3(81) năm 2016 ___ Trong thử nghiệm này, nhóm tác giả cũng so sánh giá trị các chỉ số DB-I và Kappa khi phân loại bằng thuật toán K – Means, ISODATA và Mountain. Kết quả nhận được cho thấy, giá trị chỉ số DB-I đối với kết quả phân loại bằng thuật toán Mountain là 2,3721 so với 4,2413 và 3,4198 khi phân loại bằng thuật toán K – Means và ISODATA. Trong khi đó, giá trị chỉ số Kappa khi phân loại bằng thuật toán Mountain, K – Means và ISODATA lần lượt là 0,7183; 0,5843 và 0,6259 (Bảng 6). Bảng 6. So sánh độ chính xác của kết quả phân loại với các thuật toán K – Means và ISODATA Phương pháp STT K - Means ISODATA Moutain Chỉ số đánh giá 1 DB-I 4,2413 3,4198 2,3721 2 Kappa 0,5843 0,6259 0,7183 4. Kết luận Phân tích kết quả nhận được cho thấy, ứng dụng thuật toán phân cụm Mountain cho kết quả phân loại lớp phủ trên ảnh vệ tinh Landsat tốt hơn nếu so với một số thuật toán thông dụng khác như K – Means và ISODATA. Để đánh giá độ chính xác, trong nghiên cứu đã thử nghiệm phân loại lớp phủ trên ảnh vệ tinh Landsat đối với hai khu vực khác nhau: khu vực miền núi (huyện Bảo Lâm, tỉnh Lâm Đồng) và khu vực đồng bằng, đô thị (thành phố Thái Nguyên, tỉnh Thái Nguyên). Kết quả so sánh các chỉ số DB-I và Kappa cho thấy, đối với thử nghiệm 1, giá trị đạt được khi sử dụng thuật toán Mountain là 2,1974 (DB-I) và 0,6732 (Kappa), so với 5,2312 và 3,7612 (DB-I), 0,4256 và 0,5721 (Kappa) khi phân loại bằng thuật toán K-Means và ISODATA tương ứng. Trong khi đó, với thử nghiệm 2, giá trị các chỉ số DB-I và Kappa khi phân loại bằng thuật toán Mountain là 2,3721 (DB-I) và 0,7183 (Kappa), so với 4,2413 (DB-I) và 0,5843 (Kappa) đối với K – Means; 3,4198 (DB-I) và 0,6259 (Kappa) đối với ISODATA. Như vậy, có thể khẳng định, phương pháp sử dụng thuật toán Mountain đã cải thiện đáng kể độ chính xác khi phân loại lớp phủ từ ảnh vệ tinh khi so sánh với các thuật toán không giám sát như K – Means và ISODATA. TÀI LIỆU THAM KHẢO 1. Trịnh Lê Hùng, Mai Đình Sinh (2014), “Phát hiện và phân loại vết dầu trên biển từ tư liệu ảnh ENVISAT sử dụng phương pháp lọc thích nghi và Fuzzy logic”, Tạp chí Dầu khí, số 05, tr.49-55. 2. Ali Asghar Torahi, Suresh Chand Rai (2011), “Land Cover Classification and Forest Change Analysis Using Satellite Imagery - A Case Study in Dehdez Area of Zagros Mountain in Iran”, Journal of Geographic Information System, 3, pp.1-11. 142
  12. TẠP CHÍ KHOA HỌC ĐHSP TPHCM Mai Đình Sinh và tgk ___ 3. Davies, DL, Bouldin, D.W. (1979), “A cluster separation measure”. IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 1, No2. 4. Dunn, J. C. (1974), “Well separated clusters and optimal fuzzy partitions”, J. Cybern. Vol.4, pp. 95-104. 5. Junnian Wanga, Jianxun Liu and Lanxia Liu, “A mountain means clustering algorithm”, Proceedings of the 7th World Congress on Intelligent Control and Automation, China, pp. 5045-5049. 6. Jung W.Lee, Se0 H.Son, Soon H.Kwon (2001), “Advanced Mountain Clustering Method”, ©2001 IEEE, pp. 275-280. 7. R. Geerken, B. Zaitchik, J.P. Evans (2005), “Classifying rangeland vegetation type and coverage from NDVI time series using Fourier Filtered Cycle Similarity”, International Journal of Remote Sensing, Vol. 26, No. 24, pp. 5535–5554. 8. Rouse J.W., Hass R.H., Schell J.A., Deering D.W. (1973), “Monitoring vegetation systems in the Great Plains with ERTS”, In 3rd ERTS symposium, NASA SP-351 I, 1973, pp. 309 – 317. 9. Mai Dinh Sinh, Trinh Le Hung, Dao Khanh Hoai (2015), “Unsupervised Classification using Fuzzy Probability and Fuzzy Clustering for LANDSAT Satellite Imagery”, Nation Conference of GIS 2015, Hanoi, pp. 7-11. 10. Miin-Shen Yang and Kuo-Lung Wu, “A modified mountain clustering algorithm”, THEORETICAL ADVANCES, pp. 25-38. 11. National Aeronautics and Space Administration (NASA), LANDSAT Science data user’s Handbook, 270. 12. Nishchal K. Verma, Payal Gupta, Pooja Agrawal, M. Hanmandluc, Shantaram Vasikarla and Yan Cui (2009), “Medical Image Segmentation Using Improved Mountain Clustering Approach”, Sixth International Conference on Information Technology: New Generations, pp. 1307-1312. 13. Sinh Dinh Mai, Long Thanh Ngo (2015), “Interval Type-2 Fuzzy C-Means Clustering with Spatial Information for Land-Cover Classification”, The 7th Asian Conference on Intelligent Information and Database Systems (ACIIDS 2015), part I, Springer LNAI 9011, pp. 387-397. 14. Veronica S. Moertini (2002), “Introduction to five data clustering algorithms”, INTEGRAL, Vol. 7, No. 2, pp. 87-96. 15. Weina Wang, Yunjie Zhang, Yi Li and Xiaona Zhang (2006), “The Global Fuzzy C- Means Clustering Algorithm”, Proceedings of the 6th World Congress on Intelligent Control and Automation, June 21 - 23, 2006, Dalian, China. 16. (Ngày Tòa soạn nhận được bài: 12-01-2016; ngày phản biện đánh giá: 23-02-2016; ngày chấp nhận đăng: 17-3-2016) 143