Bài giảng Các hệ thống thông tin số

pdf 49 trang ngocly 80
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Các hệ thống thông tin số", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_cac_he_thong_thong_tin_so.pdf

Nội dung text: Bài giảng Các hệ thống thông tin số

  1. 1 TRƢỜNG ĐẠI HỌC HÀNG HẢI VIỆT NAM KHOA CÔNG NGHỆ THÔNG TIN BỘ MÔN HỆ THỐNG THÔNG TIN BÀI GIẢNG CÁC HỆ THỐNG THÔNG TIN SỐ TÊN HỌC PHẦN : CÁC HỆ THỐNG THÔNG TIN SỐ MÃ HỌC PHẦN : 17410 TRÌNH ĐỘ ĐÀO TẠO : ĐẠI HỌC CHÍNH QUY DÙNG CHO SV NGÀNH : CÔNG NGHỆ THÔNG TIN HẢI PHÒNG - 2011
  2. 2 MỤC LỤC MỤC LỤC 2 CHƢƠNG 1. TỔNG QUAN VỂ HỆ THÔNG TIN ĐỊA LÝ 5 1. Tổng quan về hệ thông tin địa lý 5 2. GIS là gì 6 2.1. Định nghĩa GIS 6 2.2. Cơ sỡ dữ liệu GIS 7 3. Các lĩnh vực khoa học công nghệ liên quan tới GIS 8 4. Các lĩnh vực ứng dụng GIS 8 5. Các thành tố của hệ thống thông tin địa lý 9 5.1. Con ngƣời 9 5.2. Dữ liệu 10 5.3. Phần mềm 11 5.4. Phần cứng 11 5.5. Giao diện ngƣời dùng 11 6. Chức năng của hệ thống thông tin địa lý 12 6.1. Thu thập dữ liệu 12 6.2. Xử lý dữ liệu thô 13 6.3. Lƣu trữ và truy cập dữ liệu 13 6.4. Tìm kiếm và phân tích không gian 15 6.5. Hiển thị đồ họa và tƣơng tác 17 CHƢƠNG 2. HỆ THỐNG THAM CHIẾU KHÔNG GIAN 18 1. Hệ toạ độ địa lý 18 2. Hệ toạ độ quy chiếu 19 3. Các phép chiếu cơ bản 19 3.1. Hệ thống phép chiếu UTM (Universal Transverse Mercator) 20 3.2. Phép chiếu Robinson 22 CHƢƠNG 3. MÔ HÌNH VÀ CẤU TRÚC DỮ LIỆU KHÔNG GIAN 23 1. Các khái niệm cơ sở 23 2. Mô hình thông tin không gian 23 3. Mô hình dữ liệu raster 24 3.1. Trƣờng raster đơn giản 25 3.2. Cấu trúc dữ liệu raster 26 4. Mô hình dữ liệu vectơ 28 4.1. Cấu trúc dữ liệu toàn đa giác 28 4.2. Cấu trúc dữ liệu cung-nút 29 5. Mô hình dữ liệu lƣới tam giác không đều 29 5.1. Phƣơng pháp Voronoi 29 5.2. Cấu trúc địa lý TIN 30 6. Biến đổi từ vectơ sang raster và ngƣợc lại 30 6.1. Biến đổi vectơ sang raster 31 6.2. Biến đổi raster sang vectơ 33 CHƢƠNG 4. XÂY DỰNG CƠ SỠ DỮ LIỆU GIS 34 1. Thu thập thông tin địa lý và các phƣơng pháp nhập dữ liệu địa lý 34 1.1. Tìm kiếm bản đồ phù hợp 35 1.2. Số hóa bản đồ 35 2. Cơ sở dữ liệu thông tin địa lý 39 2.1. Tệp cơ sở dữ liệu 39 2.2. Ứng dụng CSDL trong GIS 41 MỘT SỐ ĐỀ THI MẪU 44
  3. 3 Tên học phần: Các hệ thống thông tin số Loại học phần: 2 Bộ môn phụ trách giảng dạy: Hệ thống Thông tin Khoa phụ trách: CNTT. Mã học phần: 17410 Tổng số TC: 2 Tổng số tiết Lý thuyết Thực hành/ Xemina Tự học Bài tập lớn Đồ án môn học 45 30 15 0 không không Học phần học trƣớc: Không yêu cầu. Học phần tiên quyết: Không yêu cầu. Học phần song song: Không yêu cầu. Mục tiêu của học phần: Cung cấp kiến thức cơ bản về các hệ thống thông tin số và các hệ thống thông tin địa lý. Nội dung chủ yếu: Giới thiệu về các hệ thống thông tin địa lý (GIS); Các thuật ngữ địa lý; Kiến trúc và chức năng của các hệ thống thông tin địa lý; Chuẩn bị dữ liệu không gian; Phân tích dữ liệu không gian; Biểu diễn trực quan dữ liệu không gian. Nội dung chi tiết: PHÂN PHỐI SỐ TIẾT TÊN CHƢƠNG MỤC TS LT TH BT KT Chƣơng I. Giới thiệu về hệ thống thông tin địa lý (GIS) 6 6 0 1. Tổng quan về hệ thông tin địa lý 2. GIS là gì 3. Các lĩnh vực khoa học công nghệ liên quan tới GIS 4. Các lĩnh vực ứng dụng GIS 5. Các thành tố của hệ thống thông tin địa lý 6. Chức năng của hệ thống thông tin địa lý Chƣơng II. Hệ thống tham chiếu không gian 9 6 3 1. Hệ toạ độ địa lý 2. Hệ toạ độ quy chiếu 3. Các phép chiếu cơ bản Chƣơng III. Mô hình và cấu truc dữ liệu không gian 14 8 6 1. Các khái niệm cơ sở 2. Mô hình thông tin không gian 3. Mô hình dữ liệu raster 4. Mô hình dữ liệu vectơ 5. Mô hình dữ liệu lƣới tam giác không đều 6. Biến đổi từ vectơ sang raster và ngƣợc lại Chƣơng IV. Xây dựng cơ sở dữ liệu GIS 16 10 6 1. Thu thập thông tin địa lý và các phƣơng pháp nhập dữ liệu địa lý 2. Cơ sở dữ liệu thông tin địa lý Nhiệm vụ của sinh viên: Tham dự các buổi học lý thuyết và thực hành, làm các bài tập đƣợc giao, làm các bài thi giữa học phần và bài thi kết thúc học phần theo đúng quy định. Tài liệu học tập: 1. Đặng Văn Đức, Hệ thống tin địa lý GIS, Nhà xuất bản Khoa học và Kỹ thuật 2001. 2. Rolf A.de By, Principles of Geographic Information Systems, 2nd edition, ITC, Enschede, The Netherlands, 2001. Hình thức và tiêu chuẩn đánh giá sinh viên: - Hình thức thi: tự luận. - Tiêu chuẩn đánh giá sinh viên: căn cứ vào sự tham gia học tập của sinh viên trong các buổi học lý thuyết và thực hành, kết quả làm các bài tập đƣợc giao, kết quả của các bài thi giữa học phần và bài thi kết thúc học phần. Thang điểm: Thang điểm chữ A, B, C, D, F.
  4. 4 Điểm đánh giá học phần: Z = 0,3X + 0,7Y. Bài giảng này là tài liệu chính thức và thống nhất của Bộ môn Hệ thống Thông tin, Khoa Công nghệ Thông tin và đƣợc dùng để giảng dạy cho sinh viên. Ngày phê duyệt: / / Trƣởng Bộ môn
  5. 5 CHƢƠNG 1 TỔNG QUAN VỀ HỆ THỐNG THÔNG TIN ĐỊA LÝ 1. Tổng quan về hệ thông tin địa lý Địa lý (geography) đƣợc hình thành từ hai khái niệm: trái đất (geo-earth) và tiến trình mô tả (graphy). Nhƣ vậy, địa lý đƣợc xem nhƣ tiến trình mô tả trái đất. Khi mô tả trái đất, các nhà địa lý luôn đề cập đến quan hệ không gian. Chìa khóa của nghiên cứu các quan hệ không gian là bản đồ. Theo Hiệp hội Bản đồ Quốc tế thì bản đồ là biểu diễn bằng đồ họa tập các đặc trƣng trừu tƣợng và các quan hệ không gian trên bề mặt trái đất. Nói một cách khác bản đồ là quá trình chuyển đổi từ thông tin bề mặt trái đất sang bản đồ giấy. Hệ thống thông tin là tập các tiền xử lý dữ liệu thô để sản sinh ra các thông tin có ích cho công tác lập quyết định. Chúng bao gồm các thao tác dẫn chúng ta đi từ lập kế hoạch quan sát và thu thập dữ liệu tới lƣu trữ và phân tích dữ liệu, tới sử dụng các thông tin suy diễn trong việc lập quyết đinh. Theo quan niệm này thì bản đồ cũng là một loại hệ thông tin. Bản đồ là tập hợp các dữ liệu, các thông tin suy diễn từ nó đƣợc sử dụng vào công việc lập quyết định. Hệ thông tin địa lý là hệ thông tin đƣợc thiết kế để làm việc với dữ liệu quy chiếu không gian hay tọa độ địa lý. Khái niệm hệ thông tin địa lý đƣợc hình thành từ ba khái niệm: địa lý, thông tin và hệ thống đƣợc viết tắt là GIS. Ý nghĩa của chúng đƣợc diễn giải nhƣ sau: Geographic Information System (Mỹ). Geographical Information System (Anh, Úc, Canada). Geographic Information Science (nghiên cứu lý thuyết và quan niệm của hệ thông tin địa lý vá các công nghệ thông tin địa lý). Geographic Information Studies (nghiên cứu về ngữ cảnh xã hội của thông tin). Khái niệm “địa lý“ đƣợc sử dụng tại đây vì GIS trƣớc hết liên quan đến các đặc trƣng địa lý hay không gian. Các đặc trƣng này đƣợc ánh xạ hay liên quan đến các đối tƣợng không gian. Chúng có thể là các đối tƣợng vật lý, văn hóa hay kinh tế trong tự nhiên. Các đặc trƣng trên bản đồ là biểu diễn ảnh của các đối tƣợng không gian trong thế giới thực. Biểu tƣợng, màu và kiểu đƣờng đƣợc sử dụng để thể hiện các đặc trƣng không gian khác nhau trên bản đồ 2D. Khái niệm “thông tin” đề cập đến khối dữ liệu khổng lồ do GIS quản lý. Các đối tƣợng thế giới thực đều có tập riêng các dữ liệu chữ-số thuộc tính hay đặc tính (còn gọi là dữ liệu phi hình học, dữ liệu thống kê) và các thông tin vị trí cần cho lƣu trữ, quản lý các đặc trƣng không gian. Khái niệm “hệ thống” đề cập đến cách tiếp cận hệ thống của GIS. Mỗi trƣờng hệ thống GIS đƣợc chia nhỏ thành các môđun để dễ hiểu, dễ quản lý nhƣng chúng đƣợc tích hợp thành hệ thống thống nhất, toàn vẹn. Công nghệ thông tin đã trở thành quan trọng, cần thiết cho tiệm cận này và hầu hết các hệ thống thông tin đều đƣợc xây dựng trên cơ sở máy tính.
  6. 6 Khái niệm “công nghệ thông tin địa lý” (geographic information technology) là công nghệ thu thập và xử lý thông tin địa lý. Chúng bao gồm ba loại cơ bản sau: Hệ thống định vị toàn cầu (global postioning system-GPS): đo đạc vị trí trên mặt đất dựa trên cơ sở hệ thống các vệ tinh. Viễn thám (remote sensing): sử dụng vệ tinh để thu thập thông tin về trái đất. Hệ thông tin địa lý (GIS). 2. GIS là gì Thông tin địa lý bao gồm dữ liệu về bề mặt trái đất và các diễn giải dữ liệu để con ngƣời dễ hiểu. Nhìn chung thì thông tin địa lý đƣợc thu thập từ bản đồ hay đƣợc thu thập thông qua đo đạc, viễn thám, điều tra, phân tích hay mô phỏng. Thông tin địa lý bao hàm hai loại dữ liệu: không gian và phi không gian. 2.1. Định nghĩa GIS Hiện nay có rất nhiều định nghĩa về GIS, nhƣng đều có điểm giống nhau nhƣ: bao hàm khái niệm dữ liệu không gian, phân biệt giữa hệ thông tin quản lý và GIS. So với bản đồ thì GIS có lợi thế là lƣu trữ dữ liệu và biểu diễn chúng là hai công việc tách biệt nhau. Do vậy GIS cho khả năng quan sát từ các góc độ khác nhau trên cùng tập dữ liệu. Sau đây là một số định nghĩa GIS hay sử dụng: Định nghĩa của dự án The Geographer’s Craft, khoa địa lý, trƣờng đại học Texas GIS là CSDL số chuyên dụng trong đó hệ trục tạo độ không gian là phƣơng tiện tham chiếu chính. GIS bao gồm các công cụ để thực hiện các công việc sau đây:  Nhập dữ liệu từ bản đồ giấy, ảnh vệ tinh, ảnh máy bay, số liệu điều tra và các nguồn khác.  Lƣu trữ dữ liệu, khai thác, truy vấn CSDL.  Biến đổi dữ liệu, phân tích, mô hình hóa, bao gồm các dữ liệu thống kê và dữ liệu không gian.  Lập báo cáo, bao gồm các bản đồ chuyên đề, các bảng biểu, biểu đồ và kế hoạch. Từ định nghĩa trên ta thấy rõ ba vấn đề sau của GIS. Thứ nhất, GIS có quan hệ với ứng dụng CSDL, toàn bộ thông tin trong GIS đều liên kết với tham chiếu không gian, CSDL GIS sử dụng tham chiếu không gian nhƣ phƣơng tiện chính để lƣu trữ và xâm nhập thông tin. Thứ hai, GIS là công nghệ tích hợp, hệ GIS đầy đủ có các khả năng phân tích bao gồm phân tích ảnh máy bay, ảnh vệ tinh hay tạo lập mô hình thống kê, vẽ bản đồ Cuối cùng, GIS đƣợc không chỉ xem nhƣ tiến trình phần cứng, phần mềm rời rạc mà còn đƣợc sử dụng vào trợ giúp quyết định. Định nghĩa của David Cowen, Mỹ
  7. 7 GIS là hệ thống phần cứng, phần mềm và các thủ tục đƣợc thiết kế để thu thập, quản lý, xử lý, phân tích, mô hình hóa và hiển thị các dữ liệu qui chiếu không gian để giải quyết các vấn đề quản lý và lập kế hoạch phức tạp. Độ phức tạp của thế giới thực là không giới hạn, song con ngƣời luôn mong lƣu trữ, quản lý các dữ liệu về thế giới thực thế nên phải có CSDL lớn vô hạn để lƣu trữ thông tin chính xác về chúng. Do vậy, để lƣu trữ đƣợc dữ liệu không gian của thế giới thực và máy tính thì phải giảm số lƣợng dữ liệu đến mức có thể quản lý đƣợc bằng tiến trình đơn giản hóa hay trừu tƣợng hóa. Trừu tƣợng là đơn giản một cách thông minh, trừu tƣợng cho ta tổng quát hóa và ý tƣởng hóa vấn đề đang xem xét, loại bỏ các chi tiết dƣ thừa mà chỉ tập trung vào các điểm chính, cơ bản. Các đặc trƣng đại lý phải đƣợc biểu diễn bởi các thanh phần rời rạc hay các đối tƣợng để lƣu vào CSDL máy tính. GIS Trừu tƣợng Phần hóa mềm CSDL công cụ + Ngƣời sử dụng Thế giới thực Kết quả Hình 1.1: Hệ thống tin địa lý Ý nghĩa chủ yếu của tin học hóa thông tin địa lý là khả năng tích hợp các kiểu và nguồn dữ liệu khác biệt. Mục tiêu của GIS là cung cấp cấu trúc một cách hệ thống để quản lý các thông tin địa lý khác nhau và phức tạp, đồng thời cung cấp các công cụ, các thao tác hiển thị, truy vấn, mô phỏng Cái GIS cung cấp là cách thức suy nghĩ mới về không gian. Phân tích không gian không chỉ là truy cập mà còn cho phép khai thác các quan hệ và tiến trình biến đổi của chúng. GIS lƣu trữ thông tin thế giới thực thành các tầng bản đồ chuyên đề mà chúng có khả năng liên kết địa lý với nhau. 2.2. Cơ sỡ dữ liệu GIS CSDL GIS là một nhóm xác định các dữ liệu trong một cấu trúc của một phần mềm quản lý CSDL, đó là tập hợp của các dữ liệu không gian và phi không gian. - Dữ liệu không gian: là những mô tả số của hình ảnh bản đồ, chúng bao gồm tạo độ, quy luật và các ký hiệu dùng để sác định một hình ảnh cụ thể trên bản đồ. - Dữ liệu phi không gian (dữ liệu thuộc tính): diễn tả đặc tính, số lƣợng, mối quan hệ của các hình ảnh bản đồ với vị trí địa lý của chúng. Dữ liệu không gian Dữ phi liệu không gian Dạng thông tin Điểm, đƣờng, vùng, ghi chú. Thuộc tính, tham khảo địa lý, chỉ số địa lý, các quan hệ không gian. Lƣu trữ dạng
  8. 8 Tọa độ, ký hiệu, chấm điểm, quy luật hiển thị. Chữ số, ký tự Ví dụ tại thành phố Hải Phòng. Chúng ta có thể tách bản đồ ra thành các tầng nhƣ trong hình vẽ dƣới đây: Tầng biên hành chính Tầng khách hàng Tầng đƣờng quốc lộ Tầng nhà ở Hình1.2: Tầng bản đồ 3. Các lĩnh vực khoa học công nghệ liên quan tới GIS GIS đƣợc xây dựng dựa trên các tri thức của nhiều ngành khoa học khác nhau để tạo ra một ngành khoa học mới. Trong đó: Ngành địa lý: là ngành liên quan mật thiết tới vấn đề hiểu thế giới và vị trí của con ngƣời trong thế giới, cung cấp các kỹ thuật phân tích không gian. Ngành bản đồ: bản đồ chính là dữ liệu đầu vào của GIS đồng thời cũng là khuôn mẫu quan trọng nhất của đầu ra GIS. Công nghệ viễn thám, ảnh máy bay: ảnh viễn thám và ảnh máy bay là nguồn dữ liệu quan trọng của GIS. Viễn thám bao gồm cả kĩ thuật thu thập và xử lý dữ liệu mọi vị trí trên địa cầu với giá rẻ, ảnh máy bay và kỹ thuật đo chính xác của chúng là nguồn dữ liệu chính xác về độ cao bề mặt trái đất sử dụng làm đầu vào của GIS. Bản đồ địa hình: cung cấp dữ liệu có chất lƣợng cao về vị trí của ranh giới đất đai, nhà cửa Ngành đo đạc, thống kê: cung cấp các vị trí cần quản lý và các phƣơng pháp phân tích dữ liệu GIS. Ngành thống kê đặc biệt quan trọng trong việc hiểu các lỗi hoặc tính không chắc chắn trong dữ liệu GIS. Khoa học tính toán: tự động thiết kế bằng máy tính cung cấp các kỹ thuật nhập, hiển thị, biểu diễn dữ liệu. Máy tính hoạt động nhƣ một chuyên gia trong việc thiết kế bản đồ, phát sinh các dặc trƣng bản đồ. Toán học: các ngành nhƣ hình học, đồ thị đƣợc sử dụng trong thiết kế và phân tích dữ liệu không gian. 4. Các lĩnh vực ứng dụng GIS
  9. 9 Công nghệ GIS ngày càng đƣợc sử dụng rộng rãi. GIS có khả năng sử dụng dữ liệu không gian và phi không gian từ các nguồn khác nhau khi thực hiện phân tích không gian để trả lời các câu hỏi của ngƣời dùng nhƣ:  Có cái gì ở ? Nhận diện: nhận biết tên hay các thông tin khác của đối tƣợng nào đó trên bản đồ.  ở đâu? Vị trí: chỉ ra một hoặc nhiều vị trí thỏa mãn yêu cầu ngƣời dùng.  Cái gì thay đổi từ ? Xu thế: câu hỏi liên quan trực tiếp đến các dữ liệu không gian tạm thời, ví dụ nhƣ câu hỏi liên quan tới phát triển thành phố sẽ đƣa ra các vùng qui hoạch chính trên bản đồ GIS.  Đƣờng đi nào tốt nhất từ đến ? Tìm đƣờng đi tối ƣu: dựa trên cơ sở mạng lƣới của đƣờng đi cho biết đƣờng đi nào là rẻ nhất, ngắn nhất mở rộng ra là đƣờng đi qua một hệ thống điểm.  Giữa và có quan hệ gì? Mẫu: câu hỏi này khác phức tạp tác động trên nhiều tập dữ liệu nhƣ quan hệ giữa vị trí nhà máy và địa phƣơng, khí hậu và vùng sản xuất  Cái gì xẩy ra nếu ? Mô hình: đây là câu hỏi liên quan đến các hoạt động lập kế hoạch và dự án nhƣ khi nâng cấp hệ thống giao thông tại Hải Phòng thì ảnh hƣởng thế nào tới mạng lƣới cung cấp điện, điện thoại, nƣớc, dân cƣ Dƣới đây là một vài ứng dụng chủ yếu của GIS trong thực tế: Quản lý và lập kế hoạch mạng lƣới đƣờng phố: bao gồm các chức năng tìm kiếm địa chỉ, tìm ví trí khi biết địa chỉ đƣờng phố; điều khiển đƣờng đi, lập kế hoạch lƣu thông xe cộ; phân tích vị trí, chọn địa điểm xây dựng các công trình công cộng; lập kế hoạch phát triển đƣờng giao thông. Giám sát tài nguyên thiên nhiên, môi trƣờng: bao gồm chức năng quản lý tài nguyên, phân tích tác động môi trƣờng Quản lý đất đai: lập kế hoạch cùng, miền sử dụng đất; quản lý tƣới tiêu Quản lý và lập các dịch vụ công cộng: bao gồm các chức năng tìm địa điểm cho các công trình ngầm; quản lý, bảo dƣỡng công trình Phân tích tổng điều tra dân số, lập bản đồ các dịch vụ y tế, bƣu điện và các dịch vụ công cộng khác 5. Các thành tố của hệ thống thông tin địa lý Hệ thống GIS bao gồm năm thành tố chính: con ngƣời, phƣơng pháp, công cụ phần cứng, phần mềm và dữ liệu. 5.1. Con ngƣời Con ngƣời ở đây là các chuyên viên tin học, chuyên gia GIS, thao tác viên GIS, phát triển ứng dụng GIS bao gồm:
  10. 10 Ngƣời sử dụng hệ thống: là những ngƣời sử dụng GIS để giải quyết các vấn đề không gian. Nhiệm vụ chủ yếu của họ là số hóa bản đồ, kiểm tra lỗi, soạn thảo, phân tích các dữ liệu thô và đƣa ra các giải pháp cuối cùng để truy vấn dữ liệu địa lý. Những ngƣời này phải thƣờng xuyên đƣợc đào tạo lại do GIS thay đổi liên tục và yêu cầu mới của kỹ thuật phân tích. Thao tác viên hệ thống: có trách nhiệm vận hành hệ thống hàng ngày để ngƣời sử dụng hệ thống làm việc hiệu quả. Công việc của họ là sửa chữa khi chƣơng trình bị tắc nghẽn hay là công việc trợ giúp nhân viên thực hiện các phân tích có độ phức tạp cao. Họ còn làm việc nhƣ quản trị hệ thống, quản trị CSDL, an toàn, toàn vẹn CSDL tránh hƣ hỏng, mất mát dữ liệu. Nhà cung cấp GIS: cung cấp các phần mềm, cập nhật phần mềm, phƣơng pháp nâng cấp cho hệ thống. Nhà cung cấp dữ liệu: là các cơ quan nhà nƣớc hay tƣ nhân cung cấp các dữ liệu sửa đổi từ nhà nƣớc. Ngƣời phát triển ứng dụng: là những lập trình viên, họ xây dựng giao diện ngƣời dùng, giảm khó khăn các thao tác cụ thể trên hệ thống GIS Chuyên viên phân tích hệ thống GIS: là nhóm ngƣời chuyên nghiên cứu thiết kế hệ thống, đƣợc đào tạo chuyên nghiệp có trách nhiệm xác định các mục tiêu của hệ GIS trong cơ quan, hiệu chỉnh hệ thống, đề xuất kỹ thuật phân tích đúng đắn 5.2. Dữ liệu Dữ liệu thống kê gắn theo các hiện tƣợng tự nhiên với những mức độ chính xác khác nhau. Hệ thống thƣớc đo của chúng bao gồm các biến tên, số thứ tự, khoảng và tỉ lệ. Trong đó: Biến tên: những biến chỉ có tên, không theo một trật tự nào cả, ví dụ nhƣ các loại đất (công viên, vùng dân cƣ, đất công nghiệp ) , loại cây trồng (ngô, khoai, sắn) Biến thứ tự là danh sách các lớp rời rạc nhƣng có trật tự nhƣ trình độ học vấn (tiểu học, trung học, đại học, sau đại học), độ lớn (nhỏ, trung bình, lớn) các giá trị ở đây chỉ là phản ánh một cách tƣơng đối không chính xác số lƣợng vì vậy không thể thực hiện các phép tính toán đƣợc. Biến khoảng cũng có trình tự tự nhiên nhƣng khoảng cách của chúng có ý nghĩa nhƣ nhiệt độ, diện tích. Biến tỷ lệ có cùng đạc tính nhƣ biến khoảng nhƣng chúng có giá trị 0 tự nhiên hay điểm bắt đầu nhƣ lƣợng mƣa, dân số. Ngoài bốn loại dữ liệu trên GIS còn phân chia dữ liệu thành hai lớp khác nhau là không gian và phi không gian.Ví dụ nhƣ nhà hát lớn Hải Phòng, giá trị cặp kinh độ, vĩ độ là dữ liệu không gian
  11. 11 dạng đơn giản nhất và các thông tin khác nhƣ khối lƣợng khí lƣu thông, kết cấu thép là dữ liệu thuộc tính hay phi không gian. Mỗi hệ GIS đều có kết nối giữa hai loại dữ liệu này. Hệ GIS cần phải hiểu đƣợc dữ liệu trong các khuôn mẫu khác nhau không chỉ riêng khuôn dữ liệu triêng của hệ thống. Ví dụ nhƣ đƣờng biên bản đồ có thể trong khuôn mẫu tệp DXF của AutoCad hay BNA của AtlasGis. Thông thƣờng, GIS hiểu ngay khuôn mẫu DXF mà không cần sửa đổi đồng thời GIS phải hiểu ngay khuôn mẫu DBF của các thuộc tính đƣợc lƣu trữ kèm theo. Phần mềm GIS lý tƣởng đọc đƣợc các dữ liệu raster (DEN, GIFF, TIFF, JPEG, EPS) và khuôn mẫu vectơ (TIGER, HPGL, DXF, DLG, Postscript) một số phần mềm GIS chỉ có chức năng nhập dữ liệu vào các cấu trúc dữ liệu đơn giản nhƣ cấu trúc thực thể, cấu trúc tô pô. Với dữ liệu ba chiều, phần lớn phần mềm GIS trợ giúp lƣới tam giác không đều (TIN), một số khác trợ giúp cấu trúc raster trên cơ sở lƣới bao vây và cây tứ phân, số còn lại xây dựng một khuôn mẫu riêng cho mình tùy vào nhà sản xuất phầm mềm nhƣng thƣờng là theo khuôn mẫu chuẩn quốc gia, quốc tế nhƣ SDTS (Spatial Data Transfer Santard) hay DIGEST. 5.3. Phần mềm Một hệ thống GIS bao gồm nhiều môdun phần mềm. Khả năng lƣu trữ, quản lý dữ liệu không gian bằng hệ quản trị CSDL địa lý là khía cạnh quan trọng nhất của GIS. Một phần mềm xử lý GIS tốt phải cung cấp cho ngƣời sử dụng các công cụ quản lý, phân tích không gian dễ dàng, chính xác. Thu thập Giao dữ liệu diện ngƣời dùng Quản trị Phân tích Chuyển CSDL địa lý không đổi dữ gian liệu Hiển thị, báo cáo, thống kê Hình 1.3: Phần mềm GIS 5.4. Phần cứng GIS đòi hỏi các thiết bị ngoại vi đặc biệt nhƣ bàn số hóa, máy vẽ, máy quét ảnh vào/ra. Các thiết bị có thể đƣợc nối với nhau thông quan thiết bị truyền tin hay mạng cục bộ. 5.5. Giao diện ngƣời dùng Giao diện đồ họa cho phép ngƣời dùng dễ dàng thực hiện các theo tác địa lý và các thao tác khác nhƣ truy nhập CSDL, làm báo cáo
  12. 12 6. Chức năng của hệ thống thông tin địa lý Các chức năng của GIS có thể chia làm năm loại nhƣ sau: Thu thập dữ liệu. Xử lý sơ bộ dữ liệu. Lƣu trữ và tuy nhập dữ liệu. Tìm kiếm và phân tích không gian Hiển thị đồ họa và tƣơng tác. Sức mạnh của hệ thống GIS khác nhau là khác nhau, kỹ thuật xây dựng các chức năng trên cũng rất khác nhau. Hình 1.4 mô tả quan hệ giữa các nhóm chức năng và cách biểu diễn thông tin khác nhau của GIS. Hiện tƣợng Tài liệu, bản quan sát đồ giấy Thu thập dữ liệu Dữ liệu thô Thiết bị CSDL hiển thị Lƣu trữ và Xử lý sơ bộ Hiển thị và khai thác dữ liệu thô tƣơng tác Dữ liệu có cấu trúc Tìm kiếm và phân tích Diễn giải Hình 1.4: Các nhóm chức năng của GIS 6.1. Thu thập dữ liệu Thu thập dữ liệu là quá trình thu nhận dữ liệu theo khuôn mẫu áp dụng đƣợc cho GIS. Mức độ đơn giản nhất của thu thập dữ liệu là chuyển đổi khuôn mẫu dữ liệu có sẵn từ bên ngoài. Tong trƣờng hợp này GIS phải có môdun chƣơng trình hiểu đƣợc các khuôn mẫu dữ liệu chuẩn nhƣ DLG, DXF hay các dữ liệu đầu ra của GIS nhƣ Mapinfor, Arc Info, MapObject GIS còn phải có
  13. 13 khả năng nhập các ảnh bản đồ trong khuôn mẫu GIFF, JPEG Trên thực tế nhiều kĩ thuật trắc đặc đƣợc áp dụng để thu thập dữ liệu nhƣ qua vệ tinh, máy bay, số hóa những bản đồ giấy Phần lớn dữ liệu không gian là các bản đồ giấy, GIS phải số hóa chúng mới sử dụng đƣợc, trình tự số hóa bao gồm: Mã hóa dữ liệu: là tiến trình gắn thuộc tính của đặc trƣng vào toàn bộ đối tƣợng hình học trên bản đồ, chúng có thể là điểm, đƣờng, vùng công việc này thƣờng đƣợc thực hiên qua nhập bàn phím. Kiểm chứng và sửa lỗi là so sánh hình vẽ từ dữ liệu số hóa với tài liệu nguồn. Phải đảm bảo mọi đặc trƣng trên bản đồ đƣợc số hóa với độ chính xác cần thiết. Nhìn chung công việc thu thập dữ liệu là nhiệm vụ khó khăn và nặng nề nhất trong quá tình xay dựng một ứng dụng GIS. 6.2. Xử lý dữ liệu thô Hai khía cạnh chính của xử lý dữ liệu thô bao gồm: Phát sinh dữ liệu có cấu trúc tôpô. Với dữ liệu ảnh vệ tinh thì phải phân lớp các đặc trƣng trong ảnh thành các hiện tƣợng quan tâm. Mô hình quan niệm của thông tin không gian bao gồm mô hình hƣớng đối tƣợng, mạng và bề mặt. Quá trình phân tích trên cơ sở khác nhau đòi hỏi dữ liệu phải đƣợc biểu diễn và tổ chức cho phù hợp. Điều này đòi hỏi không chỉ chức năng tọa lập mô hình dữ liệu vectơ có cấu trúc tôpô và mô hình dữ liệu raster, mà còn có khả năng thay đổi cách biểu diễn, thay đổi phân lớp và sơ đồ mẫu, làm đơn giản háo hay tổng quát hóa dữ liệu, biến đổi giữa hệ thống trục tọa độ khác nhau và biến đổi các phép chiếu bản đồ. Một số công cụ phân tích của GIS phụ thuộc chặt chẽ vào mô hình dữ liệu raster, do vậy nó đòi hỏi quá trình biến đồi mô hình dữ liệu vectơ sang raster, hay raster hóa. Biến đổi từ raster sang mô hình vectơ, hay vectơ hóa, đặc biệt cần thiết khi tự động quét ảnh. Raster hóa là tiến trình chia đƣờng hay cùng thành các tế bào. Ngƣợc lại, vectơ hóa là tập hợp các tế bào (pixel) lại thành đƣờng hay vùng. Khi so sánh dữ liệu từ các nguồn khác nhau, vấn đề chung nảy sinh là sử dụng hai hay nhiều phân lớp hay sơ đồ mã hóa cho cùng hiện tƣợng. Để nhận ra các khía cạnh khác nhau của hiện tƣợng với dữ liệu có mức độ chi tiết khác nhau, cần phải có tiến trình xấp xỉ hóa hay đơn giản hóa để biến đổi về cùng một sơ đồ. Một vấn đề nữa nảy sinh khi tích hợp dữ liệu bản đồ là hệ thống tọa độ của chúng đƣợc đo vẽ trên cơ sở nhiều phép chiếu bản đồ khác nhau. Các dữ liệu không thể tích hợp trên cùng bản đồ nếu không biến đổi chúng về cùng hệ trục tọa độ nên phải đƣa chúng cùng về một hệ tạo độ địa lý. 6.3. Lƣu trữ và truy cập dữ liệu
  14. 14 Chức năng lƣu trữ dữ liệu trong GIS liên quan đến tạo lập CSDL không gian. Nội dung của CSDL này có thể tổ hợp dữ liệu vectơ và/hoặc, dữ liệu raster, dữ liệu thuộc tính để nhận danh hiện tƣợng tham chiếu không gian. Thông thƣờng dữ liệu thuộc tính của GIS trên cơ sở đối tƣợng đƣợc lƣu trong bảng, chúng chửa chỉ danh duy nhất, tƣơng ứng với đối tƣợng không gian, kèm theo rất nhiều mục dữ liệu thuộc tính khác nhau. Chỉ danh đối tƣợng không gian duy nhất đƣợc dùng để liên kết giữa dữ liệu thuộc tính và dữ liệu không gian tƣơng ứng. Đôi khi mục dữ liệu trong bảng thuộc tính bao gồm cả giá trị không gian nhƣ độ dài đƣờng, diện tích vùng mà chúng đã đƣợc dẫn xuất từ biểu diễn dữ liệu hình học. Ví dụ dƣới đây là về dữ liệu đất: s sS1 s1 s7 ID Số hiệu Chủ đất Thời gian P1s1 P2 P3 P1 123 Thành 1982 s3 s2 P2 523 Đạt 1988 s8 P3 642 Nghĩa 1953 s5 s4 P4 P5 s 6 dữ liệu phi không gian ID Đoạn thẳng ID Tọa độ đoạn thẳng P1 S1s2, s2s5 P1 (x1,y1) (x2, y2); (x2,y2) (x5, y5) P2 S1s2, s2s4, s4s3,s3s7 P2 P3 S3s7,s3s8 P3 dữ liệu hình học (không gian) Hình 1.5: Liên kết dữ liệu không gian và phi không gian Trong mô hình dữ liệu raster thì các tệp thuộc tính thông thƣờng chứa dữ liệu liên quan tới hiện tƣợng tự nhiên thay cho đối tƣợng rời rạc. Việc lựa chọn mô hình raster hay vectơ để tổ chức dữ liệu không gian đƣợc thực hiện khi thu thập dữ liệu vì mỗi mô hình tƣơng ứng với cách tiếp cận, mô tả thông tin khác nhau. Tuy nhiên rất nhiều CSDL của GIS cho khả năng quản trị cả hai mô hình không gian nói trên, khi xây đựng CSDL không gian thì cần thiết phải liên kết bảng dữ liệu liên quan đến hiện tƣợng tự nhiên tƣơng ứng. Công nghệ CSDL truyền thống không thích hợp để quản lý dữ liệu địa lý. Một số hệ thống GIS xây dựng CSDL dựa trên tổ hợp các mô hình: Mô hình quan hệ quản lý thuộc tính phi hình học. Lƣợc đồ chuyên dụng, phi quan hệ để lƣu trữ, xử lý dữ liệu không gian. Một số khác lợi dụng các phƣợng tiện của lƣợc đồ lƣu trữ CSDL quan hệ để quản lý cả hai lại dữ liệu: hình học và phi hình học song tƣơng đối khó khăn, phức tạp.
  15. 15 Phƣơng tiện truy nhập trong CSDL GIS cần bao gồm cả phƣơng tiện có sẵn của CSDL quan hệ chuẩn để truy vấn tới một thuộc tính của đối tƣợng nào đó, thông tin của đối tƣợng trong khoảng nào đó Đặc biệt trong CSDL GIS là khả năng xác định dữ liệu theo vị trí và theo các quan niệm không gian, đây là nền tảng quá trình xâm nhập CSDl của hệ GIS. 6.4. Tìm kiếm và phân tích không gian Đây là chức năng đóng vai trò rất quan trọng trong GIS. Nó tạo nên sức mạnh thực sự của GIS so với các phƣơng pháp khác. Tìm kiếm và phân tích dữ liệu không gian giúp tìm ra những đối tƣợng đồ hoạ theo các điều kiện đặt ra hay hỗ trợ việc ra quyết định của ngƣời dùng GIS. Có rất nhiều các phƣơng pháp tìm kiếm và phân tích dữ liệu không gian, các phƣơng pháp khác nhau thƣờng tạo ra các ứng dụng GIS khác nhau. Sau đây là một số phƣơng pháp đƣợc dùng phổ biến nhất: Tìm kiếm dữ liệu trong vùng không gian (Buffer) Buffer đƣợc sử dụng trong việc xác định các đối tƣợng xung quanh một hay nhiều các điểm mốc. Quá trình thực hiện bao gồm việc tạo ra một vùng đệm quanh các điểm mốc đó và sau đó xác định các đối tƣợng căn cứ vào vị trí của chúng so với vùng đệm này. Một bài toán rất điển hình cho phƣơng pháp Buffer này là bài toán về “Nhà máy hoá chất và các bệnh viện”. Mục đích của bài toán là xác định các vị trí thuận tiện nhất trên bản đồ cho việc di dời các bệnh viện trong trƣờng hợp nhà máy hoá chất gặp sự cố. Các nhà máy hoá chất và bệnh viện đƣợc biểu diễn trên bản đồ bằng các đối tƣợng điểm. Mỗi nhà máy bao gồm các thông tin chi tiết về loại hoá chất sản xuất và mức độ phát tán chất độc ra môi trƣờng trong các điều kiện thời tiết khác nhau. Khi có sự cố, vùng nguy hiểm cần di dời sẽ đƣợc thể hiện trên bản đồ. Từ đó, chúng ta có thể biết đƣợc nên chuyển bệnh viện đến vùng nào là an toàn và thuận tiện nhất. Tìm kiếm theo địa chỉ (Geocoding) Một đối tƣợng trên bản đồ bao giờ cũng đƣợc biểu diễn bằng một kiểu dữ liệu đồ hoạ. Phần đồ hoạ này có thể thu đƣợc bằng cách số hoá hay quét ảnh bản đồ. Tuy nhiên, khi ta đã có bản đồ (bản đồ số), chúng ta cũng có thể xác định đƣợc phần đồ hoạ biểu diễn đối tƣợng hay là vị trí, hình dạng của đối tƣợng thông qua các dữ liệu mô tả vị trí của nó ví dụ: số nhà, tên đƣờng, tên quận Geocoding (hay address matching) là một tiến trình nhằm xác định các đối tƣợng trên cơ sở mô tả vị trí của chúng. Đây là một kỹ thuật rất nổi tiếng, có mặt trong rất nhiều ứng dung của GIS. Ngƣời ta gọi một geocoding service là quá trình chuyển đổi toàn bộ mô tả thuộc tính về vị trí sang mô tả không gian. Để tìm đƣợc vị trí thông qua địa chỉ, geocoding service phải tham chiếu đến ít nhất một nguồn dữ liệu bao gồm cả thông tin về địa chỉ (thuộc tính) và thông tin không gian (vị trí, hình dạng). Dữ liệu này đƣợc gọi là dữ liệu tham chiếu. Các geocoding service có thể thao tác trên nhiều kiểu dữ liệu tham chiếu khác nhau. Sau khi đã geocoding dữ liệu tham chiếu (tức là ánh xạ mô tả thuộc tính vào mô tả không gian) ta có thể nhập địa chỉ của đối tƣợng cần tìm. Quy trình xử lý trải qua các bƣớc sau:
  16. 16  Chuẩn hoá giá trị địa chỉ vừa nhập vào bằng cách tách nó thành các thành phần địa chỉ nhỏ.  Geocoding service sau đó sẽ tìm trong nguồn dữ liệu tham chiếu để xác định các đối tƣợng có các thành phần địa chỉ tƣơng ứng với dữ liệu nhập vào.  Tập kết quả trả về sẽ đƣợc gán các trọng số (điểm) để tìm ra kết quả gần đúng nhất.  Geocoding service sẽ đánh dấu đối tƣợng vừa đƣợc tìm thấy trên bản đồ bằng một đối tƣợng đồ hoạ. Phân tích mạng (Networks) Networks là kỹ thuật đƣợc ứng dụng rất rộng rãi trong giao thông, phân phối hàng hoá và dịch vụ, vận chuyển nƣớc hay xăng dầu trong các đƣờng ống dài Trong GIS, networks đƣợc mô hình dƣới dạng các đồ thị một chiều hay mạng hình học. Mạng hình học này bao gồm các đối tƣợng đang đƣợc hiển thị trên bản đồ, mỗi đối tƣợng đóng vai trò là cạnh hoặc nút trong mạng. Trong GIS để thiết lập nên mối quan hệ giữa nút - cạnh và cạnh - cạnh ta cần tạo các tôpô cho cơ sở dữ liệu. Tôpô đƣợc hiểu là mối quan giữa các đối tƣợng trong bảng dữ liệu. Quan hệ tôpô giữa các đối tƣợng gần giống quan hệ relationship giữa các bảng. Chúng ta có hai kiểu luật liên kết là nút - cạnh và cạnh - cạnh. Nút - cạnh là luật liên kết đƣợc thiết lập giữa một nút của đối tƣợng A với một cạnh của đối tƣợng B. Cạnh - cạnh là luật liên kết giữa một cạnh của đối tƣợng A và một cạnh của đối tƣợng B qua một tập các nút. Khi đã tạo tôpô và xác lập luật liên kết, một mạng lôgic đã đƣợc hình thành. Lúc này ta có thể áp dụng các thuật toán về mạng để giải quyết các bài toán đặt ra. Phủ chùm hay chồng bản đồ (Overlay) Overlay là quá trình chồng khít hai lớp dữ liệu bản đồ với nhau để tạo ra một lớp bản đồ mới. Đây là kỹ thuật khó nhất và cũng là mạnh nhất của GIS. Overlay cho phép ta tích hợp dữ liệu bản đồ từ hai nguồn dữ liệu khác nhau. Điều này tƣơng tự nhƣ việc nhân hai ma trận để tạo ra một ma trận mới, truy vấn hai bảng cơ sở dữ liệu để tạo ra bảng mới, với overlay là gộp hai lớp trên bản đồ để tạo ra bản đồ mới. Overlay thực hiện điều này bằng cách kết hợp thông tin một lớp này với một lớp khác để lấy ra dữ liệu thuộc tính từ một trong hai lớp. Ngƣời ta chia overlay thành ba dạng phân tích khác nhau:  Point-in-polygon: chồng khít hai lớp point và polygon, đầu ra là lớp point  Line-in-polygon: chồng khít hai lớp line và polygon, đầu ra là lớp line.  Polygon-in-polygon: chồng khít hai lớp polygon và polygon, đầu ra là lớp polygon. Hai lớp đƣa vào overlay phải có sự thống nhất với nhau. Thống nhất về hệ quy chiếu, thống nhất về tỷ lệ, có đƣợc điều kiện này ta mới tiến hành overlay đƣợc. Quá trình overlay thƣờng đƣợc tiến hành qua 2 bƣớc: Xác định tọa độ các giao điểm và tiến hành chồng khít hai lớp bản đồ tại giao điểm này và kết hợp dữ liệu không gian, thuộc tính của hai lớp bản đồ. Các phép toán overlay bao gồm: phép hợp (Union), phép giao (Intersect) và phép đồng nhất (Identity).
  17. 17 Phân tích biên (Boundary) Phân tích đƣờng biên của các đối tƣợng nhƣ giao điểm, đôi khi việc xác định giao điểm giúp cho việc sửa lỗi song xác định giao điểm giữa các biên là khá khó khăn. Tìm kiếm trong khoảng cận kề (Proximity): có 3 phƣơng pháp. Phƣơng pháp thứ nhất đƣợc xem nhƣ mở rộng của tìm kiếm dữ liệu trong vùng, trong đó vùng tìm kiếm đƣợc xác định bởi xấp xỉ tới hiện tƣợng có sẵn. Việc tìm kiếm này đƣợc thực hiện trong vùng tạo bởi mở rộng đối tƣợng cho trƣớc theo một khoảng cách cho trƣớc. Trong GIS vùng này đƣợc gọi là vùng đệm, nó đƣợc xây dựng xung quanh đối tƣợng điểm, đối tƣợng đƣờng hay đối tƣợng vùng. Phƣơng pháp thứ hai của tìm kiếm cận kề là tìm ra các vùng nối trực tiếp với đối tƣợng xác định trƣớc, chẳng hạn nhƣ tìm các mảnh đất liền kề với mảnh đất sẽ xây dựng nhà máy. Phƣơng pháp thứ ba của tìm kiếm cận kề xảy ra khi cần phải tìm kiếm những vùng gần nhất tới tập các vị trí mẫu phân tán không đều. Các mẫu thƣờng là các điểm. Tìm kiếm này thực hiện bằng cách tạo lập đa giác Thiessen, nó xác định các vùng xung quanh mỗi điểm mà gần điểm này hơn mọi điểm khác. Sơ đồ đa giác Thiessen còn đƣợc gọi là sơ đồ Voronoi, chúng đƣợc sử dụng để lập ra bản đồ sử dụng từ các mẫu đất cách biệt. 6.5. Hiển thị đồ họa và tƣơng tác Tầm quan trọng bản chất không gian của thông tin địa lý là đặc tả truy vấn và báo cáo kết quả là nhờ sử dụng bản đồ. Do vậy các chức năng lập bản đồ thƣờng thấy ở trong GIS. Các chức năng này đƣợc thể hiện bằng thực đơn nhƣ trong các trình vẽ bản đồ không phải là GIS thực thụ, để xác định màu, kiểu, mẫu của điểm, đƣờng, vùng. Chúng có khả năng trang trí bản đồ bằng xâu kí tự, chú giải với các thuộc tính khác nhau nhƣ loại, cỡ phông, hƣớng vẽ. Nhiều hệ GIS còn có khả năng biến đổi và vẽ theo các phép chiếu bản đồ khác nhau. Gần đây, biểu đồ diện tích đƣợc quan tâm nhiều đến để hiển thị dữ liệu. Trong đó, kích thƣớc đặc trƣng bản đồ đƣợc biến đổi tƣơng ứng với các biến thuộc tính nhƣ mật độ dân số hay thu nhập. Kỹ thuật hiển thị khác giúp hiểu dễ dàng một số loại dữ liệu bằng thay đổi độ đâm nhạt hay sắc tố màu thay vì mô tả chính xác các đƣờng biên. Biểu diễn thay đổi thời gian trên bản đồ cũng là nhu cầu thực tế, đôi khi chúng đƣợc đánh dấu trên cùng một bản đồ trong các thời điểm khác nhau và liên kết chúng bằng mũi tên. Các hệ GIS mới thƣờng cố gắng xây dựng cơ chế phát sinh bản đồ hoạt ảnh, trong đó bản đồ tự thực hiện thay đổi sau khoảng thời gian ngắn. Một khả năng khác của GIS là khả năng hiển thị bản đồ 3D từ các điểm quan sát khác nhau, hiển thị 3D cho khả năng hiểu biết về bản chất của hiện tƣợng khi nghiên cứu thay đổi bề mặt địa hình. Câu hỏi ôn tập. 1. Định nghĩa GIS. Các thành phần của GIS. 2. Nêu các chức năng của GIS.
  18. 18 CHƢƠNG 2 HỆ THỐNG THAM CHIẾU KHÔNG GIAN Hình 2.1. Tọa độ cầu Vị trí của vật thể trong không gian đều phải gắn liền với một hệ toạ độ. Trong GIS, để biểu diễn dữ liệu không gian ngƣời ta thƣờng dùng 2 hệ toạ độ là: hệ toạ độ địa lý và hệ toạ độ quy chiếu. Hệ toạ độ địa lý là hệ toạ độ lấy mặt cầu ba chiều bao quanh trái đất làm cơ sở. Một điểm đƣợc xác định bằng kinh độ và vĩ độ của nó trên mặt cầu. Hệ toạ độ quy chiếu là hệ toạ độ hai chiều thu đƣợc bằng cách chiếu dữ liệu bản đồ nằm trên hệ toạ độ địa lý về một mặt phẳng. 1. Hệ toạ độ địa lý Hệ tọa độ địa lý sử dụng bề mặt hình cầu để xác định vị trí của một điểm trên trái đất. Đơn vị đo của hệ là độ. Vì đây là hệ tọa độ gắn liền với trục trái đất nên để xác định vị trí của đối tƣợng ngƣời ta chia bề mặt trái đất thành các đƣờng kinh tuyến và vĩ tuyến. Kinh tuyến là các đƣờng cong cách đều nhau chạy qua hai điểm cực Bắc và Nam, vĩ tuyến là các đƣờng tròn song song có tâm nằm trên trục của trái đất. Giao điểm giữa kinh tuyến và vĩ tuyến tạo thành các ô lƣới. Trong số các kinh tuyến và vĩ tuyến có hai đƣờng quan trọng nhất đƣợc lấy làm gốc toạ độ đó là: đƣờng xích đạo và kinh tuyến chạy qua vùng Greenland nƣớc Anh. Giao điểm giữa hai đƣờng này là gốc toạ độ. Hai đƣờng này cũng đồng thời chia trái đất làm 4 phần bằng nhau: nửa Bắc và Nam nằm phía trên và dƣới của đƣờng xích đạo; nửa Đông và Tây nằm ở phía bên phải và trái của kinh tuyến gốc. Một điểm nằm trên mặt cầu sẽ có hai giá trị toạ độ là kinh độ và vĩ độ đƣợc xác định nhƣ trong hình vẽ trên. Giá trị này có thể đƣợc đo bằng độ theo cơ số 10 hoặc theo độ, phút, giây. Miền giá trị của vĩ độ: -900 900 Miền giá trị của kinh độ: -1800 1800 Chỉ trên đƣờng xích đạo thì khoảng cách một độ của vĩ tuyến mới bằng khoảng cách một độ trên kinh tuyến. Trên các vĩ tuyến khác khoảng cách này khác nhau rất nhiều. Ngƣời ta tính rằng một độ trên kinh tuyến dài khoảng 111,321 km trong khi 600 trên vĩ tuyến chỉ có độ dài 55,802 km. Chính vì sự khác nhau này nên ta không thể đo chính xác đƣợc chiều dài và diện tích của đối tƣợng khi dữ liệu bản đồ đƣợc chiếu lên mặt phẳng. Trong hệ toạ độ địa lý có hai bề mặt hình cầu đƣợc sử dụng đó là: mặt cầu (tuyệt đối) và mặt Ellipsoid. Vì bề mặt của trái đất của ta không phải là hình cầu tuyệt đối mà nó gần với hình Ellipsoid nên mặt Ellipsoid thƣờng đƣợc dùng để biểu diễn. Tuy nhiên đôi khi ngƣời ta cũng sử dụng mặt cầu để công việc tính toán dễ dàng hơn. Khi tỷ lệ bản đồ rất nhỏ (nhỏ hơn 1:5000.000), ở tỷ lệ này sự khác biệt giữa dữ liệu biểu diễn bằng mặt cầu và mặt Ellipsoid là không thể phân biệt
  19. 19 đƣợc bằng mắt thƣờng. Lúc này, mặt cầu đƣợc dùng. Nhƣng khi tỷ lệ lớn hơn 1:1.000.000 thì ngƣời ta cần thiết phải dùng mặt Ellipsoid để đảm bảo độ chính xác. Do đó, việc lựa chọn mặt cầu hay mặt Ellipsoid phụ thuộc vào mục đích của bản đồ và độ chính xác dữ liệu. Nếu mặt cầu dựa trên hình tròn thì mặt Ellipsoid lại có cơ sở là hình Ellip. Hình Ellip đƣợc xác định bởi hai bán trục mà ta hay gọi là: bán trục lớn và bán trục nhỏ. Ta cho Ellip xoay quanh bán trục nhỏ ta sẽ thu đƣợc hình Ellipsoid. Kích thƣớc và hình dạng của Ellipsoid đƣợc xác định bởi bán trục lớn a và bán trục nhỏ b, hay bởi a và hệ số dẹt f = (a - b) / a. Vì hệ số f rất nhỏ nên ngƣời ta thƣờng dùng giá trị 1/f (l: bán kính xích đạo, f: bán kính cực). 2. Hệ toạ độ quy chiếu Để thuận tiện cho sử dụng ngƣời ta phải nghiên cứu cách thể hiện bề mặt trái đất lên trên mặt phẳng của bản đồ. Do đó phải thực hiện phép chiếu bề mặt cong của trái đất lên mặt phẳng và hệ toạ độ quy chiếu ra đời. Hệ toạ độ này luôn lấy hệ toạ độ địa lý làm cơ sở. Hệ toạ độ quy chiếu đƣợc đặc trƣng bởi hai trục X, Y theo phƣơng ngang và thẳng đứng. Gốc toạ độ là giao điểm của hai trục này. Hai trục giao nhau đồng thời chia mặt phẳng làm 4 phần tƣơng ứng với 4 phần trong hệ toạ độ địa lý. Một điểm trên mặt đƣợc xác định đƣợc xác định bởi cặp giá trị (x, y). Có rất nhiều phép chiếu bề mặt cong của trái đất lên mặt phẳng song về cơ bản ta có thể hiểu nhƣ sau. Lấy một mảnh bìa cuộn xung quanh bề mặt cầu trong hệ toạ độ địa lý theo một hình trụ đứng. Từ tâm của bề mặt cong ta vẽ các tia cắt các điểm giao giữa kinh tuyến và vĩ tuyến, đồng thời kéo dài cắt mặt trụ. Thực chất của việc này là chiếu các ô lƣới lên bề mặt phẳng. Mở tờ bìa ra ta có kết quả của phép chiếu. Nhìn vào tấm bìa ta nhận thấy, các ô lƣới đã thay đổi khá nhiều (biến dạng), co lại hoặc dãn ra. Càng xa đƣờng xích đạo thì sự biến dạng càng lớn. Điều này gây nên sự thay đổi về hình dạng, kích thƣớc, khoảng cách của dữ liệu không gian. Sau đó ngƣời ta dùng các công thức toán học để tƣơng ứng toạ độ của bề mặt cong lên toạ độ mặt phẳng chiếu. Các phép chiếu khác nhau gây ra các biến dạng bản đồ khác nhau nên việc sử dụng phép chiếu nào là dựa vào mục đích của bản đồ và độ chính xác của dữ liệu. 3. Các phép chiếu cơ bản Trong phần này ta sẽ tìm hiểu ba phép chiếu cơ bản và thƣờng đƣợc sử dụng nhất đó là phép chiếu với mặt chiếu: mặt hình nón, mặt hình trụ và mặt phẳng phương vị. Bƣớc đầu tiên khi tiến hành phép chiếu này là tạo ra một hay một tập các điểm tiếp xúc. Các điểm tiếp xúc này đƣợc gọi là các tiếp điểm hay là tiếp tuyến. Các điểm này có vai trò rất quan trọng, vì độ biến dạng của phép chiếu trên những điểm này bằng không. Độ biến dạng sẽ tăng khi khoảng cách giữa điểm chiếu và điểm tiếp xúc tăng. Mặt hình nón
  20. 20 Để thực hiện phép chiếu này ngƣời ta cho dùng một mặt hình nón “úp” lên bề mặt cầu. Đƣờng thẳng tiếp xúc giữa mặt nón và mặt cầu là một vĩ tuyến và đƣợc gọi là vĩ tuyến chuẩn. Các đƣờng kinh tuyến sau khi chiếu mặt nón sẽ thành những đƣờng thẳng đứng, các đƣờng vĩ tuyến sẽ tạo thành những đƣờng tròn. Sau khi thực hiện phép chiếu, ngƣời ta sẽ cắt hình nón dọc theo một kinh tuyến bất kỳ, lúc này ta sẽ đƣợc kết quả của phép chiếu trên bề mặt nón. Sự giao nhau giữa những đƣờng thẳng và cung tròn sẽ tạo nên một mặt lƣới. Đƣờng thẳng đối diện với đƣờng cắt đƣợc gọi là kinh tuyến trung tâm. Càng xa vĩ tuyến chuẩn độ biến dạng càng tăng. Do đó để tăng độ chính xác ngƣời ta cắt bỏ phần đỉnh của mặt nón hay ta không tiến hành chiếu lên vùng này. Phép chiếu này thƣờng đƣợc dùng cho việc chiếu các vùng có các vĩ tuyến trung bình chạy qua và hƣớng theo chiều đông - tây. Mặt hình trụ Giống nhƣ phép chiếu mặt nón, phép chiếu này cũng có một đƣờng thẳng tiếp tuyến. Khi sử dụng mặt trụ, ngƣời ta phân làm 3 loại tuỳ thuộc vào vị trí tƣơng đối của mặt trụ so với mặt cầu:  Hình trụ đƣợc đặt theo phƣơng thẳng đứng và tiếp xúc với mặt cầu theo một vĩ tuyến, thƣờng là đƣờng xích đạo. Gọi là phép chiếu Mercator.  Hình trụ đƣợc đặt theo phƣơng nằm ngang, đƣờng thẳng tiếp xúc là một kinh tuyến. Gọi là phép chiếu Transverse.  Hình trụ đặt xiên và tiếp xúc với mặt cầu theo một đƣờng tròn có bán kính lớn nhất (bằng với bán kính đƣờng xính đạo). Gọi là phép chiếu Oblique. Phép chiếu thƣờng đƣợc sử dụng nhất là Mercator. Trong phép chiếu này, các đƣờng kinh tuyến sẽ đƣợc chiếu thành những đƣờng thẳng đứng cách đều nhau, các đƣờng vĩ tuyến sẽ trở thành những đƣờng nằm ngang khoảng cách không đều nhau; tăng dần về phía hai cực. Do đó biến dạng sẽ tăng dần về phía hai cực. Sau khi thực hiện phép chiếu, ngƣời ta sẽ cắt mặt hình trụ dọc theo một kinh tuyến, trải ra trên mặt phẳng ta sẽ thu đƣợc kết quả. Mặt phẳng phƣơng vị Đây là phép chiếu dữ liệu bản đồ lên một mặt phẳng tiếp xúc với mặt cầu. Điểm tiếp xúc này có thể là: nằm tại hai cực, tại đƣờng xích đạo, hoặc tại một vị trí bất kỳ nằm giữa. Vị trí của điểm tiếp xúc cho ta biết vị trí tƣơng đối của mặt phẳng chiếu với mặt cầu và tạo nên ba kiểu chiếu khác nhau: polar, equatorial và oblique. Mặt phẳng chiếu tiếp xúc với cực của mặt cầu là kiểu chiếu đơn giản nhất và cũng hay dùng nhất. Trong phép chiếu này, các đƣờng kinh tuyến sẽ đƣợc chiếu thành một chùm đƣờng thẳng giao nhau ở điểm cực, vĩ tuyến là các đƣờng tròn có cùng tâm là cực của mặt cầu. Góc giữa các đƣờng kinh tuyến đƣợc bảo tồn. 3.1. Hệ thống phép chiếu UTM (Universal Transverse Mercator) Có nguồn gốc từ phép chiếu Mercator ngang và thƣờng đƣợc dùng để đo vẽ bản đồ có độ chính xác cao.
  21. 21 Đặc điểm: + Phép chiếu UTM chia bề mặt Trái đất thành 60 múi theo vĩ tuyến, mỗi mũi 6o và đánh số từ 1 đến 60 kể từ kinh độ 180 Tây. Mỗi mũi kéo dài từ vĩ độ 84 Nam đến vĩ độ 84 Bắc. + Chia bề mặt Trái đất thành các dải 8o theo kinh tuyến mở ra từ đƣờng xích đạo và đƣợc gán các ký tự (từ C -> X, trừ I, O) + Các múi đặcbiệt không theo qui luật trên: Kinh độ 0 đến kinh độ 36 và trên vĩ độ 72 Bắc. Múi 32 giữa vĩ độ 56 Bắc đến vĩ độ 64 Bắc. Mụ hỡnh phộp chiếu UTm trong cỏc trƣờng hợp: + Tọa độ phẳng trong UTM qui định trục Y nằm trờn kinh tuyến trục ởo và tăng theo hƣớng Bắc. Trục X vuông góc với trục Y tại (õo , ởo) và tăng theo hƣớng Đông. (õo , ởo) là gốc tọa độ + Trái đất là hỡnh cầu: Từ kinh độ ở và vĩ độ õ ta tính đƣợc cặp tọa độ x, y theo công thức sau: x = ẵ*Rkoln[(1+B)(1-B)] y = Rko( arctg[tg(õ)/cos(ở- ởo)] - õo) B = cos(õ)sin(ở- ởo) Trong đó: R = 6.371.116 m (bán kính địa cầu) k0 = 0,9996 là sai số hỡnh chiếu trờn kinh tuyến trục ởo Từ (x, y ) ta tính đƣợc kinh độ ở và vĩ độ õ theo cụng thức sau: õ = arcsin(sin(D) / cos(x/R*ko) ) ở = ởo + arctan( sin(x/R*ko) / cos(D) ) D = y/(Rko) + õo D đƣợc tính bằng độ + Trái đất là elip trũn xoay Từ kinh độ ở và vĩ độ õ ta tính đƣợc cặp tọa độ x, y theo công thức sau: 3 2 2 x = koN [ A + (1-T+C)A / 6 + (5 – 18T + T + 72C-58e’ ) /120 ] 2 2 y = ko ( M – M0 + N*tgõo + [A / 2 + (5-T+9C+4C )] ) Trong đó: ko = 0,9996 2 2 2 e’ = e (1- e ) N= a / (1 - e2sin2(õo) ) T= tg2(õ) ; C= e’2 cos2(õo) A= (ở- ởo)cos(õ) M = a [ (1- e2/4 - 3e2/256 )õ –(3e2/8 - 3e4/32 – 45e6/ 1024) sin(2õ)] + a [ (15e4/256 - 45e6/1024 )sin(4õ) - ] + Tại Bán cầu Bắc, góc là giao của đƣờng xích đạo và kinh tuyến trục, để tránh tọa độ âm, ngƣời ta dịch trục x về phía Tây khoảng 500 km. Khi đó hệ trục tọa độ phẳng sẽ là
  22. 22 xo=500.000m; yo=0. Đối với phía Nam điểm gốc cũng sẽ thay đổi thành xo=500.000m; yo= 10.000.000. Cỏc giỏ trị (xo, yo) đƣợc sử dụng để hiệu chỉnh các giá trị x,y đƣợc tính toán. + (õo , ởo) là gốc tọa độ địa lý, trong UTm thỡ õo =0 cho mọi mỳi cũn ởo = (zone + 0,5)pi/30 – pi zone là mỳi Utm cú giỏ trị từ 1->60. 3.2. Phép chiếu Robinson Phép chiếu thuộc lớp giả trụ có nhiều lƣới nhƣ sau: + Kinh tuyến gốc là đƣờng thẳng vuông góc với đƣờng xich đạo. Các kinh tuyến khác là những đƣờng cong cách đều nhau. + Vĩ tuyến là các đƣờng thẳng song song cách đều nhau từ 38o Nam đến 38o Bắc. + Tỉ lệ bản đồ dúng theo các vĩ độ 38o Nam và 38o Bắc. Sai số càng tăng khi tiến về hai cực. + Phép chiếu đƣợc sử dụng khá phổ biến trong việc in ấn bản đồ. + Ta có thể tính đƣợc tọa độ x, y từ (õ , ở) x = 0,8487RX(ở- ởo) y = 1,3523RY Trong đó X, Y đƣợc nội suy từ bảng hàng số Robinson Câu hỏi ôn tập. 1. Trình bầy các phép chiếu cơ bản. 2. Trình bầy về hệ thống phép chiếu UTM (Universal Transverse Mercator).
  23. 23 CHƢƠNG 3 MÔ HÌNH VÀ CẤU TRÚC DỮ LIỆU KHÔNG GIAN 1. Các khái niệm cơ sở Dữ liệu: là các con số hay sự kiện đƣợc tập hợp có hệ thống cho một hay nhiều mục đích cụ thể. Chúng có thể tồn tại dƣới nhiều hình thức khác nhau nhƣ ngôn ngữ tự nhiên, biểu tƣợng, biểu thức toán, tín hiệu sóng Thông tin: đƣợc xem nhƣ dữ liệu đã đƣợc xử lý dƣới khuôn mẫu hữu ích cho ngƣời dùng và là những giá trị nhận thức cho công tác lập quyết định. Dữ liệu là thành phần của thông tin, nhƣng không phải mọi dữ liệu đều có ích, thông tin chỉ có ích khi nó tin cậy, chính xác, kịp thời, đầy đủ, dễ hiểu, dễ quản lý. Hệ thống thông tin: có nhiệm vụ chuyển đổi dữ liệu thành thông tin theo các tiến trình khác nhau nhƣ biến đổi, tổ chức, cấu trúc hoá và mô hình hoá. Hai khái niệm tổ chức và cấu trúc đóng vai trò cốt yếu trong chức năng của một hệ thống thông tin, nếu không có chúng thì không có khả năng chuyển đổi dữ liệu thành thông tin. Vào Chuyển đổi Tổ chức cấu Sửa chữa trúc Kiểm chứng Cập nhật CSDL Mô hình hoá Ra Phân tích Hình 3.1: Biến đổi dữ liệu thành thông tin Mô hình dữ liệu địa lý: là các qui tắc đƣợc sử dụng để biến đổi đặc trƣng địa của thế giới thực thành các đối tƣợng rời rạc. Mô hình dữ liệu đƣợc sử dụng để biểu diễn thực thể với mức độ phức tạp khác nhau. 2. Mô hình thông tin không gian Dữ liệu là trung tâm của hệ thống GIS , hệ thống GIS chứa càng nhiều dữ liệu thì chúng càng có ý nghĩa. Dữ liệu của hệ GIS đƣợc lƣu trữ trong CSDL và chúng đƣợc thu nhập thông qua mô hình thế giới thực. Dữ liệu trong hệ GIS còn đƣợc gọi là thông tin không gian. Đặc trƣng thông tin không gian là có khả năng mô tả “vật thể ở đâu” nhờ vị trí tham chiến , đơn vị đo và quan hệ không gian . Chúng còn khả năng mô tả “hình dạng hiện tượng” thông qua mô tả chất lƣợng, số lƣợng của hình dạng và cấu trúc. Cuối cùng, đặc trƣng thông tin không gian mô tả “quan hệ và tương tác’’
  24. 24 giữa các hiện tƣợng tự nhiên. Mô hình không gian đặc biệt quan trọng vì cách thức biểu diễn thông tin sẽ ảnh hƣởng đến khả năng hiển thị đồ họa của hệ thống . Hiện tƣợng tự nhiên đƣợc thể hiện bằng các thành phần rời rạc hay gọi là đối tượng trong CSDL. Đặc trƣng địa lý đƣợc hình thành từ các thực thể. Thực thể là hiện tƣợng đƣợc quan tâm trong thế giới thực mà nó không bị chia nhỏ ra thành các hiện tƣợng cùng loại. Khi xây dựng CSDL ta phải quan tâm đến các mức của trừu tƣợng dữ liệu nhƣ sau đây: Thế giới thực: là toàn bộ hiện tƣợng tự nhiên nhƣ chính nó tồn tại. Mô hình dữ liệu quan niệm: là các thành phần và các quan hệ giữa chúng liên quan đến hiện tƣợng tự nhiên nào đó. Mô hình dữ liệu này độc lập với hệ thống cụ thể, cấu trúc dữ liệu, tổ chức và quản lý dữ liệu. Mô hình dữ liệu vật lý hay cấu trúc tệp: là tập các qui luật để cài đặt cấu trúc dữ liệu trên các máy tính khác nhau. Thông thƣờng ta phải sử dụng một vài mô hình quan niệm trừu tƣợng không gian để giải thích và phân tích dữ liệu không gian. Mỗi mô hình sẽ nhấn mạnh một khía cạnh của hiện tƣợng không gian, nó phụ thuộc vào mục tiêu phân tích. Ở đây ta tập trung vào ba mô hình thƣờng đƣợc sử dụng trong GIS để tổ chức và xử lí dữ liệu không gian, đó là mô hình trên cơ sở đối tƣợng, mạng và nền. Mô hình không gian trên cơ sở đối tƣợng Mô hình này tập trung vào các hiện tƣợng riêng rẽ sẽ đƣợc nghiên cứu độc lập hay cùng quan hệ của chúng với hiện tƣợng khác. Bất kỳ hiện tƣợng nào đều đƣợc xem nhƣ đối tƣợng, có thể tách rời khỏi các đối tƣợng láng giềng và phải có tính phân biệt, nhận dạng duy nhất. Đối tƣợng có thể bao gồm các đối tƣợng khác. Mô hình không gian trên cơ sở mạng Mô hình chia sẻ một vài khía cạnh của mô hình đối tƣợng vì chúng đề cập đến các đối tƣợng rời rạc nhƣng đặc trƣng chính của mô hình là xem xét sự tƣơng tác giữa các đối tƣợng, thƣờng là đƣờng đi nối chúng. Hình dạng chính xác của đối tƣợng có thể không quan trọng, quan trọng ở đây là khoảng cách giữa các đối tƣợng cần xét. Ví dụ rõ nhất ở đây là mạng lƣới giao thông đƣờng bộ, đƣờng biển và đƣờng không. Mô hình quan sát trên cơ sở nền Mô hình phù hợp cho mô hình hóa hiện tƣợng, quan tâm đến các vật liên tục trải trên vài cùng không gian. Nền có thể đƣợc biểu diễn hai hay ba chiều là tùy vào loại ứng dụng. Một số dữ liệu có thể coi nhƣ nền hoặc đối tƣợng tùy vào cách thu thập dữ liệu. Ví dụ nhƣ nghiên cứu khu rừng, nếu thu thập từ ảnh thì là dữ liệu nền còn là dữ liệu đối tƣợng nếu xem xét tới đƣờng biên khu rừng. 3. Mô hình dữ liệu raster
  25. 25 Đây là phƣơng pháp biểu diễn các đặc trƣng địa lý bằng các điểm ảnh. Đƣợc hình thành dựa trên cơ sở quan sát nền thế giới thực. 3.1. Trƣờng raster đơn giản Mô hình dữ liệu raster hay còn gọi là lƣới tế bào hình thành nền cho một số hệ thông tin địa lý. Các hệ thống trên cơ sở raster hiển thị, định vị và lƣu trữ dữ liệu đồ họa nhờ sử dụng các ma trận hay lƣới tế bào. Độ phân giải dữ liệu raster phụ thuộc vào kích thƣớc của tế bào hay điểm ảnh, chúng có thể khác nhau từ vài đêximet đến vài kilômet. Tiến trình xây dựng lƣới tế bào đƣợc mô tả nhƣ sau đây: Giả sử phủ một lƣới lên bản đồ, dữ liệu raster đƣợc lập bằng cách mã hóa mỗi tế bào bằng một giá trị dựa theo các đặc trƣng trên bản đồ, độ chính xác của một đối tƣợng phụ thuộc vào kích thƣớc hay độ phân giải của các tế bào lƣới. Ví dụ dƣới sẽ chỉ rõ điều này: Bản đồ gốc Lưới (4x8) 1 4 4 4 4 4 4 4 1 2 4 4 3 1 4 4 2 2 2 4 3 3 1 1 2 2 2 4 3 1 2 4 3 3 3 1 4 4 4 4 Ma trận lưu trữ (lưới 4x8) Ma trận lưu trữ (lưới 2x4) Hình 3.2: Sự ảnh hưởng của kích thước tế bào Bản đồ lại đƣợc chia thành nhiều tầng, mỗi tầng bao gồm hàng triệu tế bào vì vậy cần áp dụng các thuật toán nén dữ liệu mà vẫn cho khả năng khôi phục dữ liệu ban đầu. Hình dạng bao phủ toàn bộ bản đồ gọi là khảm, khảm có thể là hình vuông, tam giác hay lục giác tuy nhiên khi sử dụng khảm hình tam giác hoặc lục giác sẽ khó khăn trong việc phân chia tế bào thành các tế bào nhỏ hơn, cách mã hóa, lƣu trữ tế bào khó khăn hơn rất nhiều. Lợi thế của hệ thống raster là mã dữ liệu đồ thành bản đồ trong máy tính nên các thao tác so sánh tế bào lã dễ dàng song không thuận tiên cho việc biểu diễn đƣờng, đoạn, điểm vì mỗi loại là một tập hợp các tế bào và có đoạn rộng, đoạn hẹp. Một vấn đề khó khăn nữa là xử lý tế bào trộn là tế bào có nhiều hơn một đặc trƣng (như trong ví dụ trên một số ô có thể đánh một trong hai giá trị tùy theo hoạt động của chương trình hay quan niệm của người lập), vấn đề này dẫn tới khó khăn khi có nhu cầu phân tích là phủ bản đồ. Vì thế raster thích hợp hơn với hệ thống GIS hƣớng tài
  26. 26 nguyên, môi trƣờng vì hình thành trên sơ sở quan sát nền thế giới thực. Raster có nhiều tầng bản đồ (địa hình, đất đai ) hơn so với mô hình vectơ. 3.2. Cấu trúc dữ liệu raster Số lƣợng dữ liệu của mô hình là rất lớn do đó cần có kĩ thuật quản lý khối dữ liệu sao cho dễ quản lý và dễ xâm nhập. Các phƣơng pháp hay dùng là phân hoạch dữ liệu và xây dựng chỉ số xâm nhập nhanh. Phân hoạch dữ liệu Phân hoạch CSDL không gian để quản lý khối lƣợng lớn thông tin bằng tập giới hạn các thao tác. Hai chiến lƣợc đƣợc sử dụng đó là: mỗi phân hoạch chứa số lƣợng thông tin xấp xỉ nhau và kích thƣớc địa lý có thể khác nhau; phân hoạch địa lý cố định và lƣợng thông tin trong mỗi phân hoạch có thể khác nhau. Xây dựng chỉ số xâm nhập nhanh (hay chỉ số không gian) Ý tƣởng chính của xây dựng chỉ số không gian là sử dụng khái niêm xấp xỉ qua phân hoạch số lƣợng thông tin xấp xỉ. Nếu mỗi đặc trƣng có thêm trƣờng chỉ số để chỉ ra nơi chứa chúng thì việc tìm kiếm địa chỉ sẽ giới hạn trong trƣờng này. Tiến trình đánh số chỉ số thƣờng sử dụng đó là phân hoạch đệ qui, kết quả là cho ta cấu trúc phân cấp gọi là cây tứ phân. Trong cây tứ phân mỗi vùng đƣợc chia thành bốn vùng và đánh chỉ số khác nhau, mỗi vùng lại chia tiếp thành bốn phần cho đến khi đạt đƣợc kích thƣớc tế bào cần thiết tuy nhiên phân hoạch nhƣ vậy là không hợp lý và tiến trình phân hoạch chỉ cần tiến hành ở những vùng có nhiều đặc trƣng hay đƣợc quan tâm tới nhiều tùy vào các chức năng của bản đồ. Cách đánh chỉ số ở đây thƣờng áp dụng trật tự Peano hay Z (sử dụng cách đánh số như nhau ở bốn góc phần tư), trật tự Hilbert hay (sử dụng cách đánh số đối xứng ở bốn góc phần tư) nhƣ sau: Trật tự Z Trật tự Hình 3.3: Đánh chỉ số phân vùng Ví dụ: 11 13 31 33 1 2 1 2 10 12 30 32 0 3 0 3 01 03 21 23 3 2 2 3 00 02 20 22 0 1 1 0
  27. 27 Trật tự Z Trật tự Ngoài ra có thể sử dụng sơ đồ R-tree hay R+-tree. R-tree là cây phân cấp, mỗi lá của cây là một hình chữ nhật và con trỏ, con trỏ trỏ tới đặc trƣng của hình chữ nhật bao (vùng hay thùng chứa), còn hình chữ nhật xác định bởi tọa độ x,y cực đại và cực tiểu. Tập các hình chữ nhật đƣợc đánh chỉ số là lƣu trữ trong tập các thùng. Tuy nhiên R-tree có hiện tƣợng hình chữ nhật trùng nhau nghĩa là hình chữ nhật cắt các thùng nhƣng thùng đƣợc biểu diễn chỉ trong một hình chữ nhất, điều này đƣợc xử lý trong R+-tree bằng cách chia các hình chữ nhật dữ liệu để mỗi hình đƣợc biểu diễn trong hai vùng con.
  28. 28 4. Mô hình dữ liệu vectơ Đây là phƣơng pháp biểu diễn các đặc trƣng địa lý bằng các phần tử đồ họa cơ bản (điểm, đƣờng, đa giác, bề mặt ba chiều và khối trong 3D). Phƣơng pháp vectơ hình thành dựa trên cơ sở quan sát đối tƣợng của thế giới thực. Kiểu thành phần sơ Biểu diễn đồ họa Biểu diễn vectơ cấp . + x (x,y) trong 2D Điểm (x, y, z) trong 3D danh sách tọa độ (tập các đoạn, đường thẳng trong Đƣờng trường hợp đường cong) hoặc các hàm toán học đƣờng có điểm đầu và cuối Vùng trùng nhau hay tập các đƣờng nếu vùng có lỗ Ma trận điểm, tập các tam giác, Bề mặt hàm toán học, đƣờng bình độ Khối Tập các bề mặt Điểm là thành phần sơ cấp của dữ liệu địa lý trong mô hình vectơ, các điểm đƣợc nối với nhau bởi các đƣờng để tạo thành các thực thể khác. Tùy theo tỷ lệ quan sát mà các thực thể đƣợc biểu diễn bằng điểm, đƣờng hay vùng Nhƣ vậy mô hình vectơ sử dụng các điểm hay đoạn thẳng để nhận biết các vị trí của thế giới thực nên cho phép thao tác nhiều hơn trên các đối tƣợng so với mô hình raster và chính xác hơn nhƣ tính chu vi, diện tích đặc biệt là tìm đƣờng đi nhanh và hiệu quả hơn rất nhiều. Mô hình vectơ hợp với các hệ GIS định hƣớng các hệ thống quản trị CSDL, chúng có ƣu việt trong lƣu trữ số liệu bản đồ bởi chỉ lƣu đƣờng biên của các đặc trƣng chứ không lƣu cả vùng nhƣ trong mô hình raster nên truy nhập, tìm kiếm, hiển thị dễ dàng thông tin từ CSDL. Mô hình vectơ sử dụng hai cấu trúc dữ liệu là toàn đa giác và cung-nút. 4.1. Cấu trúc dữ liệu toàn đa giác Mỗi tầng trong CSDL của cấu trúc toàn đa giác đƣợc chia thành tập các đa giác. Mỗi đa giác đƣợc mã hóa thành trật tự các vị trí hình thành đƣờng biên của vùng khép kín theo một hệ tọa độ
  29. 29 nào đó và đƣợc lƣu trữ độc lập. Do cách tổ chức nên ta không biết đƣợc các đa giác kề nhau hay nói cách khác là không có tổ chức tôpô trong cấu trúc này. Với cấu này, một điểm có thể lƣu lại nhiều lần nên việc cập nhật là rất khó khăn. 4.2. Cấu trúc dữ liệu cung-nút Một khía cạnh quan trọng của mô hình vectơ là khả năng tách biệt các thành phần để thực hiên đo đạc và xác định quan hệ không gian giữa chúng. Quan hệ này là một quan hệ tôpô, mỗi đƣờng hay vùng cắt nhau sẽ tạo ra các giao điểm (nút) và các vùng (đƣờng) mới, các vùng (đƣờng) mới này đƣợc xác định bởi các cung. Các cung, nút là các thành phần cơ bản của các tôpô trong bản đồ đã số hóa. Số chiều, hình dạng đồ họa hay dùng trên bản đồ của các tôpô cơ bản đƣợc mô tả trong bảng dƣới đây. Sô chiều Loại tôpô Biểu diễn Mô tả 0 Nút Biểu diễn điểm rời rạc, giao điểm 1 Cung Nối hai nút Cung có hƣớng Cung có hƣớng xác định Xuyến Mạch cung khép kín 2 Bề mặt Vung khép kín bởi một hay nhiều cung 3 Polyhedron Cung kép kín bởi các bề mặt Thông thƣờng tôpô ba chiều có bề mặt bao bọc, đa giác đƣợc tạo từ một hay nhiều cung. Tôpô hai chiều chỉ gồm các đa giác, cung, nút. Đa giác đƣợc tạo ra nhờ sách các cung thành phần (các cung phải có hƣớng xác định), trong đó dấu trừ (-) đƣợc sử dụng cho hƣớng cung phù hợp. Với các đa giác ló lỗ thì thƣờng qui định chiều kim đồng hồ cho biên ngoài và ngƣợc chiều kim đồng hồ cho biên trong. Các đối tƣợng không gian chia sẻ trong một tầng sẽ chỉ phải ghi một lần. Trong cấu trúc dữ liệu tôpô đa tầng, các đối tƣợng của một lớp bản đồ sẽ đƣợc ghi tại một tầng cụ thể, nhƣ vậy sẽ có các cung lặp trong các tầng và việc phân tích phủ bản đồ cần phải xác định giao điểm của các cung để thông tin chính xác. 5. Mô hình dữ liệu lƣới tam giác không đều 5.1. Phƣơng pháp Voronoi Ta xét bài toán phân bổ các cột điện thoại của thành phố sao cho mỗi máy điện thoại đƣợc nối với cột gần nhất vì thế phải chia thành phố thành các vùng, mỗi vùng có duy nhất một cột và khoảng cách từ mỗi vị trí trong vùng đến cột trong vùng đó là ngắn nhất. Kết quả phân hoạch này là sơ đồ Voronoi.
  30. 30 Sau đây là định nghĩa sơ đồ Voronoi: gọi P={p1, p2 pn}là tập các điểm trong mặt phẳng tọa độ. Các điểm này gọi là vị trí. Hãy phân hoạch mặt phẳng bằng cách gán từng điểm của nó cho vị trí gần nó nhất. Toàn bộ các điểm đƣợc gán cho pi hình thành vùng Voronoi V(pi), V(pi) bao gồm mọi điểm gần vị trí pi hơn bất kì vị trí nào khác: V(pi)={x: |pi-x| <= |pj-x|,  i j }. Trong đó, một số điểm không chỉ có một vị trí (hay láng giềng) gần nhất. Tập các điểm có nhiều láng giềng gần hơn hình thành từ sơ đồ Voronoi V (P). Đƣờng bao giữa hai vùng Voronoi gọi là sƣờn Voronoi. Một điểm là giao của ba hay nhiều hơn cạnh Voronoi gọi là đỉnh Voronoi. Cặp vị trí đủ gần nhau để chia sẻ cạnh Voronoi và tồn tại vòng tròn đi qua hai vị trí nhƣng không chứa bên trong chúng một vị trí nào khác thì gọi là cặp vị trí liên quan. Sơ đồ Voronoi của hai vị trí: xét hai điểm p1 và p2, gọi B12 là đƣờng trung trực của đoạn thẳng p1 p2 thì B12 là sơ đồ Voronoi của p1 và p2. Sơ đồ Voronoi của ba vị trí không thẳng hàng: xét ba điểm p1, p2, p3. Ta xét ba sơ đồ Voronoi B12, B23, B31 là ba đƣờng trung trực của ba đoạn p1p2, p2p3, p1p3 ba đƣờng này gặp nhau tại một điểm là tâm đƣờng tròn ngoại tiếp tâm giác p1p2p3 điểm này chính là sơ đồ Voronoi của p1, p2, p3. Sơ đồ Voronoi của nhiều vị trí (lớn hơn 3): ta tìm sơ đồ Voronoi 2 điểm bất kì, mạng lƣới thu đƣợc là sơ đồ Voronoi. Trong hệ thông tin địa lý, sơ đồ Voronoi đƣợc áp dụng để hình thành các chức năng nhƣ biến đổi đối tƣợng từ raster sang vectơ nhờ kỹ thuật tìm xƣơng, xây dựng tam giác Delaumay trong mô hình TIN 5.2. Cấu trúc địa lý TIN TIN đƣợc nghiên cứu từ những năm 70 của thế kỉ XX, các hệ thống GIS thƣơng mại có mô hình TIN xuất hiện vào những năm 80 của thế kỷ XX. TIN có khả năng biểu diễn bề mặt liên tục từ tập điểm địa lý rời rạc. Khái niệm hình học TIN là tập các đỉnh đƣợc nối với nhau thành các tam giác, các tam giác này hình thành bề mặt ba chiều. Bề mặt TIN đƣợc sử dụng để biểu diễn các vấn đề khác nhau nhƣ độ cao, lƣợng mƣa Trong GIS vectơ thì TIN đƣợc coi nhƣ các đa giác có thuộc tính là độ dốc, hƣớng và diện tích. Các đỉnh của chúng có thuộc tính độ cao, các cạnh có thuộc tính độ dốc và hƣớng. Mô hình này khá đơn giản và kinh tế. Có nhiều phƣơng pháp hình thành TIN, một phƣơng pháp phổ biến là dựa trên cơ sở xây dựng tam giác Delauney. Năm 1934 Delauney đã chứng minh nếu nối từng cặp vị trí trong sơ đồ Voronoi có hai đa giác Voronoi của chúng cùng chia sẻ một cạnh Voronoi bởi đoạn thẳng thì ta có các tam giác, các tam giác này thỏa mãn tiêu thức Delauney khi vòng tròn ngoại tiếp của chúng không bao bất cứ điểm địa lý nào khác. 6. Biến đổi từ vectơ sang raster và ngƣợc lại So sánh mô hình raster và vectơ
  31. 31 Mô hình raster Mô hình vectơ Ƣu điểm Mô hình hiệu quả Thuận tiện biểu diễn hiện tƣợng tự nhiên Dễ tổ hợp, nạp chồng Mô hình cô đọng Hƣớng ảnh vệ tinh Có khả năng tạo lập tôpô lƣới, tổng quát hóa, dễ Có khả năng mô phỏng sửa đổi Dễ phân tích dữ liệu Thao tác hình học dễ dàng, chính xác Nhƣợc điểm Chất lƣợng đồ họa hạn chế Cấu trúc dữ liệu phức tạp Khó mô hình hóa mạng Biến đổi phi tuyến phức tạp Phần lớn các hệ thống GIS trên cơ sở vectơ đều sử dụng thiết bị đồ họa trên công nghệ raster. Mỗi khi hiển thị dữ liệu vectơ trên màn hình, máy in thì phải raster hóa nhờ các giải thuật biến đổi vectơ – raster. Với hệ thống GIS trên cơ sở raster thì biến đổi raster - vectơ là thao tác cơ bản để sử dụng dữ liệu bản đồ. 6.1. Biến đổi vectơ sang raster K/n: tìm tập pixel trong không gian raster trùng khớp với vị trí của điểm, đƣờng hay đa giác trong biểu diễn vectơ. Tổng quát là tiến trình xấp xỉ vì với vùng không gian cho trƣớc thí mô hình raster chỉ có khả năng địa chỉ hóa các vị trí nhờ tọa độ nguyên. Raster hóa đƣờng thẳng Thuật toán raster hóa đoạn thẳng đƣợc thực hiện theo cách tăng dần, bắt đầu từ điểm cuối của đƣờng. Thuật toán cơ bản + Tổng số pixel tối thiểu tạo nên đoạn thẳng đƣợc xác định bởi vị trí pixel giữa hai đầu đọan thẳng theo chiều x, y. Nếu Ab là đoạn thẳng cần raster hóa, A(x1, y1); B(x2, y2) trong hệ tọa độ raster thì khoảng cách x, y sẽ là: Dx= abs(x1-x2) Dy= abs(y1-y2)  Tổng số pixel cần vẽ là o Dmax = max (Dx, Dy) o n= Dmax + 1 Giá trị dịch chuyển của x, y đƣợc xác định theo biểu thức sau: Incx = Dx/ Dmax Incy = Dy/ Dmax
  32. 32 + Để tìm vị trí pixel tiếp theo ta phải làm tròn tạo độ thành số nguyên gần nhất sau khi tăng chiều x, y nhƣ sau: For i = 1 to n-2 { x = x + incx y = y + incy ix = round(x) iy = round(y) setpixel(ix, iy); } Thuật toán Bresenham dành cho đƣờng thẳng có hệ số góc lớn hơn 0. Dựa trên tƣơng quan của Dx và Dy mà ta quyết định điểm nào sẽ đƣợc vẽ tiếp theo hay biến thiên theo chiều nào. + Dx > Dy ta cho y biến thiên theo x + Dy >= Dx ta cho x biến thiên theo y Để tăng tốc độ thực hiện ta thay số thực bằng số nguyên và tránh phép toán nhân, chia. Giả sử Dx:Dy= 8:12 thì y sẽ biến thiên theo x với tỉ lệ này, tức x tăng thêm 12 điểm thì y mới tăng 8 điểm hay khi x tăng 1 thì y tăng 8/12, ta không thực hiện chia ngay mà lƣu lại trong biến d, đến khi nào d > Dx thi cho y tăng 1 và giảm d đi Dx. Tƣơng tự với hệ số góc nhỏ hơn 0 thi ta cho một chiều tăng, chiều kia giảm. Raster hóa đa giác Tiến trình raster hóa đa giác đòi hỏi phải tìm các pixel nằm trong nó. Quá trình Raster sử dụng thuật toán biến đổi đƣờng quét đa giác, thuật toán này xác định khá tốt các điểm nằm trong đa giác nhƣng raster hóa đƣờng biên sẽ phát sinh lỗi do kích thƣớc điểm ảnh. Ở đây ta sử dụng hai phƣơng pháp để xác định pixel có nằm trên biên hay không. + Phƣơng pháp “Tâm điểm”: nếu tâm của pixel nằm trong đa giác thì nó thuộc đa giác. + Phƣơng pháp “Đơn vị trội”: Nếu diện tích phần pixel thuộc đa giác lớn hơn phần còn lại thì nó thuộc đa giác. Hai phƣơng pháp này thƣờng dẫn đến các kết quả khác nhau khi raster hóa. Cố kết đƣờng quét Một cách raster hóa đa giác khác đó là tìm ra các hàng pixel nằm gần kề của đa giác thông qua thuật toán tìm các biên của tập hợp liên tục các pixel của một hàng hay một đƣờng quét ảnh để tạo thành khối đa giác. Thuật toán biến đỏi đƣờng quét của đa giác thực hiện nhƣ sau: + Khảo sát từng đƣờng quét đi qua đa giác để tìm tọa độ giao điểm giữa chúng và cạnh đa giác. Các cạnh song song với đƣờng qút sẽ đƣợc bỏ qua. + Sắp xếp tọa độ giao điểm theo thứ tự tăng dần và làm đầy đƣờng quét giữa các cặp điểm.
  33. 33 Để tăng tốc độ thực hiện ta cần tăng tốc độ tìm giao điểm, điều này đƣợc giải quyết dễ dàng khi đã xác định đƣợc độ dốc của đa giác. 6.2. Biến đổi raster sang vectơ Các bƣớc thực hiện: + Chọn ngƣỡng: chuyển đổi cƣờng độ ảnh về ảnh hai mầu. + Làm trơn: loại bỏ các biến dạng do nhiễu, các điểm đốm. + Làm mảnh: làm mảnh đƣờng thẳng sao cho độ rộng của chúng bằng 1 pixel. + Mã xâu: chuyển ảnh vectơ thành tập các xâu pixel, mỗi xâu biểu diễn một đƣờng. + Giảm thiểu vectơ: mỗi xâu pixel đƣợc chuyển vào dãy vectơ. Làm mảnh Ở đây ta cần chú ý đến thuật toán làm mảnh. Giá sử ta cần làm mảnh màu đen trong một ảnh nhị phân. Xét với 1 pixel P có tám pixel kề. N 1 1 1 W p E 1 P 0 S 0 0 1 Ta gọi N(p) là tổng giá trị của các pixel kề, pn, pe, ps, pw là giá các pixel trên, dƣới, trái, phải. Tp là số lần biến đổi của pixel từ 0 -> 1 theo chiều kim đồng hồ. Trong ví dụ N(p) = 5; pn = 1; pe = 0; ps = 0; pw = 1; Tp = 2 Thuật toán đƣợc thực hiện nhƣ sau: Bƣớc 1: Với mỗi điểm ảnh P ta thực hiện Nếu 2=< P(n) <= 6 và T(p) = 1 và pn.pe.ps= 0 và pe.ps.pw = 0 thì đánh dấu P Bƣớc 2: Gán giá trị 0 cho các điểm đánh dấu, nếu không có điểm đánh dấu thì dừng lại. Bƣớc 3: Quay lại bƣớc 1. Mã xâu hay tạo lập xâu Xâu đƣợc hình thành từ các pixel mảnh, cần xác định xem mỗi pixel là nằm ở giữa, đầu hay cuối đoạn thẳng. Thuật toán tạo xâu sẽ tìm pixel tạo ra điểm cuối “sợi”, sau đó duyệt theo các pixel trên đƣờng và dừng lại ở điểm cuối hay giao điểm. Nhƣ vậy trật tƣ các pixel đã đƣợc tạo ra hay xâu pixel đƣợc tạo. Câu hỏi ôn tập. 1. Thực hiện thuật toán raster hóa đƣờng thẳng với dữ liệu nhƣ sau: - Nhập tọa độ điểm đầu và cuối A(x1,y1), B(x2, y2) của đoạn AB trong hệ tọa độ đề các. Nhập tỉ lệ kích thƣớc lƣới raster tƣơng ứng với hai chiều của hệ tọa độ. Đƣa ra phần lƣới raster chứa đoạn thẳng AB. 2. Thực hiện thuật toán làm mảnh. Cho file anh đen trắng, đƣa ra ảnh sau khi làm mảnh.
  34. 34 CHƢƠNG 4 XÂY DỰNG CƠ SỠ DỮ LIỆU GIS Đầu tiên ta phải thu thập dữ liệu, đây là khâu quan trọng nhất và khó khăn nhất trong quá trình lập một hệ thống GIS, dữ liệu thu thập đƣợc phải đƣợc xử lý sơ bộ trƣớc khi thực hiện các thao tác trên chúng. 1. Thu thập thông tin địa lý và các phƣơng pháp nhập dữ liệu địa lý GIS có rất nhiều loại dữ liệu cần phải thu thập tùy vào mục tiêu phản ánh khác nhau của hệ thống. Trong thời gian ban đầu mới xuất hiện GIS, ngƣời sử dụng thƣờng tự phát triển khuôn mẫu riêng để lƣu trữ GIS, do vậy rất khó khăn khi chia sẻ và chuyển đổi giữa các hệ GIS với nhau. Cộng thêm việc nhập dữ liệu vào GIS rất tốn kém thời gian, thƣờng tiêu tốn tới 80% ngân sách của dự án. Vì vậy, việc chia sẻ dữ liệu trở nên thông thƣờng trong GIS và đẩy nhanh quá trình chuẩn hóa dữ liệu và phát sinh khái niệm dữ liệu về dữ liệu để mô tả nguồn gốc và độ chính xác của các lớp GIS. Nếu dữ liệu có sẵn không phù hợp thì phải tự số hóa bản đồ. Dữ liệu trong GIS bao gồm dữ liệu hình học và phi hình học (các thuộc tính). Dữ liệu đƣợc thu thập trong hệ thống thông tin địa lý thƣờng: Dƣới dạng số nhƣ bản đồ số hóa, CSDL, bảng tính, ảnh vệ tinh Phi số hóa nhƣ bản đồ giấy, ảnh chụp, các bản vẽ Dữ liệu trắc địa Tổng hợp từ các nguồn khác Dữ liệu đƣợc thu thập qua hai phƣơng pháp chính. Thứ nhất là thu thập từ chính các đối tƣợng, phƣơng pháp này cho độ chính xác cao nhƣng tốn kém, chúng bao gồm: Trắc địa mặt đất: dùng để thu thập dữ liệu tôpô có tỷ lệ lớn nhƣ đo vẽ địa hình, đất đai. Kết quả của trắc địa là các vectơ hai hoặc ba chiều, độ chính xác trong khoảng vài xentimet đến đêximet. Phƣơng pháp định vị bằng vệ tinh: thực hiện nhờ hệ thống định vị toàn cầu (GPS). Máy thu GPS hiển thị vị trí bằng chữ và số của lƣới tọa độ chọn trƣớc. Lƣới tạo độ là mẫu vuông hay chữ nhật đặt trên bản đồ. Lƣới sử dụng để mô tả vị trí nhờ tổ hợp chữ và số. Khi sử dụng GPS thì ta có địa lý vectơ hai và ba chiều. Độ chính xác của GPS đƣợc nâng cao khi có hai máy cùng xác định một điểm thƣờng năm trong khoảng 1-2 xentimet đến 10-20 met. Chụp ảnh bằng máy bay hay vệ tinh: sử dụng các thiết bị hay cảm biến để thu thập từ xa các quan hệ phổ và không gian của đối tƣợng quan sát. Các ảnh do vệ tinh chụp đƣợc gửi về qua sóng radio và phải đƣợc xử lý theo để thu về thông tin cần thiết. Độ chính xác phƣơng pháp phụ thuộc vào chất lƣợng ảnh truyền và cách xử lý dữ liệu ảnh. Thứ hai là thu thập dữ liệu từ nguồn số hóa. Phƣơng pháp này cho dữ liệu ít chính xác hơn, chi phí cũng thấp hơn. Chúng bao gồm:
  35. 35 Số hóa bằng tay các bản đồ giấy. Sử dụng các CSDL số hóa có sẵn. Số hóa bản đồ giấy tự động bằng máy quét. 1.1. Tìm kiếm bản đồ phù hợp Tìm kiếm bản đồ phù hợp phụ thuộc vào lựa chọn vùng, chủ đề và chu kì phù hợp, thời gian phù hợp. Phần lớn thƣ viện bản đồ chứa mô tả vùng, chủ đề, thời gian phát hành, tuy nhiên ít khi thời gian thu thập dữ liệu thích hợp với thời gian phát hành bản đồ. Nhƣ hệ thống GIS phục vụ trong giao thông cần quan tâm đến các lớp bản đồ chứa thông tin về đƣờng biên hành chính, bờ biển, đƣờng đi, đƣờng sắt, các thành phố, quận huyện Các lớp này có thể chia thành các lớp con khác nhƣ lớp đƣờng sắt chia thành đƣờng đơn và đôi, đƣờng đi có lớp đƣờng quốc lộ, đƣờng nội thành (một hoặc hai chiều) 1.2. Số hóa bản đồ Khi chuẩn bị bản đồ để số hóa hay quét thì cần coi trọng phƣơng pháp qui chiếu không gian. Tiến trình tham chiếu địa lý là tiến trình cung cấp địa chỉ không gian có thể thực hiện nhờ sử dụng hẹ tọa độ địa lý, tọa độ lƣới hay không dùng tọa độ. Khi sử dụng hệ tọa độ địa lý, trái đất đƣợc coi là hình cầu. Khi sử dụng hệ tọa độ lƣới, trái đất coi nhƣ mặt phẳng. Hệ tọa độ địa lý Utm tổ hợp cả hệ tọa độ địa lý và tọa độ lƣới vì nó là tập hợp các mặt phẳng bao quanh trái đất. Nhiều hệ GIS không lƣu trữ tọa độ theo khuôn mẫu độ, phút, giây mà lƣu trữ tọa độ hệ thập phân. Do vậy, cần phải công thức chuyển đổi giữa chúng nhƣ sau: DecimalDegrees = Degrees + (Minutes + seconds/60)/60 VD: chuyển đổi 30o35’45” sang độ thập phân DecimalDegrees = 35 + (35 + 45/60)/60 = 35.59583 Số hóa bản đồ giấy bằng bàn số hóa hay nhập bản đồ giấy bằng máy quét là phƣơng pháp thƣờng đƣợc sử dụng. Số hóa bằng bàn số hóa là tiến trình ghi lại vị trí của trình tự các điểm đặc trƣng dọc theo đƣờng quét trên bản đồ. Phƣơng pháp này cho kết quả dƣới dạng bản đồ vectơ hai chiều. Kết quả nhập bản đồ số bằng máy quét là số liệu raster, nếu sử dụng công cụ phần mềm chuyển đổi raster sang vectơ thì cũng có số liệu bản đồ hai chiều. Độ chính xác của dữ liệu phụ thuộc trƣớc hết vào độ chính xác bản đồ giấy. Bàn số hóa Bao gồm bàn nhỏ chứa lƣới dây kim loại mịn đặt theo các trục Đềcác. Con trỏ chứa cuộn dây kim loại và đƣợc nối với bàn để ngƣời thao tác xác định điểm cần ghi. Vị trí chính xác đƣợc xác định nhờ dấu thập phân mỏng tại đầu con chạy. Trên con trỏ còn có các phím để nhập dữ liệu hay nhập mã lệnh. Công nghệ chung nhất của bàn số hóa dựa trên nguyên tắc điện từ. Lƣới dây trong bảng nhỏ và cuộn dây của con trỏ hoạt động nhƣ bộ thu, bộ phát hay ngƣợc lại. Nếu con trỏ là bộ
  36. 36 phát thì bộ điều khiển của bàn sẽ quét lƣới dây kim loại theo chiều X và Y để tìm ra vị trí chữ thập mỏng đầu con trỏ. Mục tiêu chính của tiến trình chuyển đổi thông tin không gian từ dạng tuyến tính sang dạng số hóa là đảm bảo quan hệ bản đồ, bao gồm:  Đảm bảo các liên kết tồn tại giữa các điểm.  Các đƣờng song song đƣợc bảo toàn.  Bảo toàn các vị trí tƣơng đối, tuyệt đối, tính liền kề.  Các đƣờng gần sát không đƣợc cắt nhau. Tiến trình số hóa thƣờng bắt đầu bằng cố định bản đồ gốc lên mặt bàn số hóa. Trƣớc hết phải số hóa các điểm điều khiển hay lƣới tạo độ để đăng ký hệ thống tọa độ, sau đó mới đến các đặc trƣng. Một phần quan trọng của số hóa bản đồ là đảm bảo thông tin tham chiếu địa lý, biểu thị bằng lƣới và các đƣờng kinh vĩ tuyến cần đƣợc lƣu trữ theo bản đố số hóa. Phần lớn bản đồ tỷ lệ trung bình và tỷ lệ lớn (trên 1:50000) đều chứa lƣới vùng cơ sở cho phép chuyển đổi tuyến tính từ tọa độ số hóa sang tọa độ lƣới. Nếu giả sử bản đồ không bị biến dạng hay không đòi hỏi độ chính xác cao thì chỉ cần ba điểm điều khiển tạo độ không thẳng hàng, nếu cần chính xác cao thì cần nhiều điểm hơn (thƣờng là 20 điểm). Bàn số hóa thƣờng có hai chế độ nhập tọa độ, đó là điểm và đƣờng. Trong chế độ điểm, bàn số hóa chỉ phát sinh tạo độ mỗi khi nhấn phím trên con chạy. Chế độ này thƣờng áp dụng để số hóa đặc trƣng điểm nhƣ độ cao điểm, thành phố trong bản đồ tỷ lệ nhỏ và các đặc trƣng đƣờng hay đa giác nhƣ hệ thống sông ngòi, đƣờng biên hành chính. Chế độ đƣờng nhằm tăng tốc độ số hóa các đặc trƣng đƣờng hay đa giác vì chúng tự động ghi lại tọa độ các điểm khi thao tác viên dịch chuyển con trỏ theo đƣờng số hóa. Việc tự động ghi tọa độ dựa trên cơ sở thời gian hay khoảng cách. Chế độ đƣờng thƣờng làm phát sinh một lƣợng lớn dữ liệu dƣ thừa vì thế chế độ điểm đƣợc sử dụng nhiều hơn. Mã hóa đặc trƣng bản đồ Sau khi số hóa các đặc trƣng điểm, đƣờng và đa giác, ta phải cung cấp thông tin kèm theo để chỉ ra ý nghĩa của chúng. Chúng có thể là thông tin phân loại lớp nhƣ khu nhà, đƣờng đi hay chỉ danh nhƣ tên đất, tên đƣờng Các thông tin này thƣờng đƣợc nhập từ bàn phím. Mã hóa điểm, đƣờng thƣờng không gặp khó khăn nhƣng với đa giác khá phức tạp vì mỗi đoạn, điểm liên kết có thể gắn với các đa giác khác. Nếu mỗi đa giác đƣợc mã hóa độc lập thì phải số hóa hai lần các đoạn thẳng chung nhau, một giải pháp tránh số hóa hai lần là liên kết với cặp mã đặc trƣng cho chúng. Cặp mã này đại diện cho các đa giác trái, phải của đoạn thẳng (khái niệm trái, phải phụ thuộc vào hƣớng của đoạn thẳng). Sau khi mã hóa đoạn thẳng biên đa giác theo cách này ta có thể xây dựng lại đa giác qua việc tìm kiếm các liên kết đoạn thẳng trái, phải của chúng, các đoạn thẳng tìm đƣợc phải đƣợc sắp xếp để có đƣợc một xâu điểm đầu và điểm cuối. Mỗi liên kết chỉ có
  37. 37 duy nhất một chỉ danh, dữ liệu địa lý đƣợc tạo ra nhờ tham chiếu đến danh sách các chỉ danh của liên kết. Tìm kiếm và hiệu chỉnh lỗi Mọi bản đồ số đều tồn tại các lỗi do xây dựng từ nguồn dữ liệu chính xác không cao hay do quá trình số hóa nên công việc sửa lỗi là cần thiết. Các lỗi do thao tác viên tạo nên thƣờng dễ sửa chữa hơn là xuất phát từ dữ liệu gốc. Các lỗi thƣờng gặp khi số hóa bản đồ để hình thành đa giác, bao gồm:  Xâu đoạn thẳng lơ lửng do vẽ quá hay vẽ hụt.  Không gán nhãn cho đa giác.  Đụng độ nhãn trong đa giác.  Xâu đoạn thẳng có cùng nhãn, đa giác trái, phải.  Hình 4.1: Lỗi đoạn thẳng lơ lửng Hình 4.2: Chập nút Trong mạng các xâu đoạn thẳng hình thành đa giác thì các xâu phải kết thúc tại các điểm nút. Khi số hóa chúng hay bị vẽ quá hoặc hụt, các lỗi này có thể phát hiện ngay khi số hóa và hiệu chỉnh qua việc kéo các đầu nút, trong hệ thống GIS chức năng này có sẵn đƣợc gọi là “chập”, có khả năng chập hai hay nhiều điểm cách nhau một khoảng cho trƣớc lại. Khi số hóa mỗi đa giác cần một điểm để đặt nhãn và lỗi trong quá trình này là thiếu nhãn hay thừa nhãn. Lỗi về đụng độ đa giác là do thao tác viên thực hiện không chính xác. Các lỗi này thƣờng phải làm lại ngay trong quá trình số hóa. Lỗi khi số hóa còn xẩy ra khi số hóa nhiều lần cùng một xâu, điều này có thể phát sinh các đa giác lạ hoặc không có điểm tham chiếu dẫn đến không xác định đƣợc chính xác đa giác, lỗi này thƣờng là do đặt sai vị trí điểm số hóa hay sai trật tự số hóa. Sử dụng tệp dữ liệu bản đồ có sẵn
  38. 38 Các dữ liệu có sẵn thƣờng là các tệp đƣờng biên, chúng mô tả hình học dƣới dạng số của các đơn vị hành chính. Cần phải tìm các dữ liệu có sẵn phù hợp với hệ GIS cần xây dựng và lƣu trữ dƣới cấu trúc dữ liệu chuẩn. Tích hợp dữ liệu bản đồ số hóa từ nhiều nguồn khác nhau Khi số hóa một bản đồ vào nhiều thời điểm khác nhau hay sử dụng các hệ tọa độ khác nhau thƣờng xẩy ra hiện tƣợng biến dạng cạnh sƣờn, các đối tƣợng nhƣ đƣờng đi, sông ngòi hay các đặc trƣng tôpô trải trên nhiều bản đồ hay mất tính liên tục. Hình 4.3: Biến dạng cạnh sườn Sau khi số hóa bản dồ dữ liệu thu đƣợc phần lớn dƣới dạng mô hình vectơ song GIS sử dụng linh hoạt cả hai mô hình vectơ và raster do đó cần phải chuyển đổi giữa hai mô hình này. Mỗi dữ liệu vectơ trên màn hình, máy in thì phải raster hóa nhờ các thuật toán biến đổi vectơ-raster trong hệ tọa độ. Với hệ thống GIS trên cơ sở raster thì thao tác biến đổi vectơ-raster là thao tác căn bản để hệ thống sử dụng đƣợc dữ liệu vectơ. Với hệ thống GIS trên cơ sở vectơ thì việc thu thập dữ liệu thông qua máy quét là dạng raster cần chuyển đổi để sử dụng.
  39. 39 2. Cơ sở dữ liệu thông tin địa lý 2.1. Tệp cơ sở dữ liệu Nhƣ ta đã biết địa lý trong GIS lƣu dƣới dang CSDL không gian, nối dung các tệp trong CSDL không gian đƣợc phân biệt bởi kiểu đối tƣợng hình học hay lớp các đặc trƣng bản đồ. Do vậy, chúng có thể là tệp thông tin tham chiếu điểm (ví trí thành phố, làng, nhà ở), tệp thông tin tham chiếu đƣờng (quốc lộ, sông ngòi ), ngoài ra có thể là tệp lƣu trữ các danh mục mã mô tả đặc trƣng và tệp chỉ số đến nội dung các tệp khác trong hệ thống. 100 144297 607410 20000 Hà Nội 102 Hải Phòng Tệp dữ liệu địa lý 220 Đà Nẵng 123 145 Chỉ danh Tọa độ X Tọa độ Y Diện tích Tên Các bảng sau đây mô tả một cách thức lƣu trữ thông tin địa lý trên tệp: Tên trƣờng Mô tả Loại Số byte FEATMO Số hiệu duy nhất của đặc trƣng Int 4 EASTING Tọa độ phía đông Int 4 NORTHING Tọa độ phía bắc Int 4 AREA Diện tích POPULATION Dân số Int 4 NAME Tên thành phố Char 30 COUNTRY Tên quốc gia Char 30
  40. 40 Tên trƣờng Mô tả Loại Số byte Bản ghi đầu tệp RFEATMO Số hiệu duy nhất của đặc trƣng Int 4 RCLASS Lớp đặc trƣng (sông ngòi, quốc lộ) Char 2 RNAME Tên đối tƣợng Char 30 NCOORDS Tổng số tọa độ Int 2 Bản ghi tọa độ LAT (1) Kinh độ Float 4 LONG (1) Vĩ độ Float 4 LAT (n) Kinh độ Float 4 LONG (n) Vĩ độ Float 4 Các bản ghi trên đƣợc hình thành từ trộn các trƣờng số và ký tự. Dữ liệu số không phải lúc nào cũng lƣu dƣới dạng số nguyên hay thực, có thể sử dụng các xâu thay thế nhƣng kém hiệu quả hơn do yêu cầu kích thƣớc dữ liệu nhiều hơn. Do vậy, dữ liệu bản đồ thƣờng đƣợc lƣu dƣới dạng số trong các tệp nhị phân. Còn các tệp độc lập với dữ liệu bản đồ lƣu dƣới dang tệp ký tự. Cũng giống nhƣ CSDL thông thƣờng, các tệp của CSDL địa lý đƣợc tổ chức theo các dạng tệp tuồn tự, tệp chỉ số, tệp chỉ số sắp xếp, danh sách kết nối, cây. Tệp dữ liệu tuần tự: Record 5 Record 4 Record 3 Record 2 Record 1 Tệp dữ liệu chỉ số: Khóa Chỉ số STT Tên thành phố Nƣớc Dân số Hà Nội 1 1 Hà Nội Việt Nam Hải Phòng 2 2 Hải Phòng Việt Nam Viên Chăn 3 3 Viên Chăn Lào
  41. 41 Tệp dữ liệu chỉ số sắp xếp: Khóa Chỉ số STT Tên thành phố Nƣớc Dân số Hải Phòng 2 1 Hà Nội Việt Nam Hà Nội 1 2 Hải Phòng Việt Nam Viên Chăn 3 3 Viên Chăn Lào Danh sách kết nối: Khóa Chỉ số STT Tên thành phố Nƣớc Con trỏ Việt Nam 1 1 Hà Nội Việt Nam 2 Lào 2 2 Hải Phòng Việt Nam 4 Thái Lan 3 3 Viên Chăn Lào 5 Cây: (ví dụ sơ đồ đường không) Hà Nội Sơn La Huế Đà Nẵng Vinh 2.2. Ứng dụng CSDL trong GIS Ngày nay, hầu hết các hệ thống thông tin đƣợc xây dựng xung quanh CSDL quan hệ. Tuy nhiên, GIS đòi hỏi CSDL của mình không những lƣu trữ đƣợc các đối tƣợng mà còn có khả năng tìm kiếm trực tiếp và tính toán dữ liệu không gian. Do đó, hệ thống GIS thƣơng mại đều đƣợc xây dựng dựa trên một trong ba kiến trúc sau: Kiến trúc đối ngẫu GIS có hai hệ thống CSDL tách biệt, một cho dữ liệu hình học và một cho dữ liệu thuộc tính. Ta gọi chúng là có kiến trúc đối ngẫu, kiến trúc này tách thành các hệ con để lƣu trữ và truy nhập dữ liệu không gian, và thông tin thuộc tính đƣợc lƣu trữ trong RDBMS. Các thành tố hình học và thuộc tính của các đối tƣợng đƣợc liên kết với nhau bởi chỉ danh duy nhất. Để xâm nhập đối tƣợng phải truy nhập cả hai hệ con sau đó tổ hợp kết quả. Lợi thế của kiến trúc này là từng phần trên cơ sở RDBMS chuẩn cho nên việc lƣu trữ và truy nhập có hiệu quả cao nhƣng bất lợi ở chỗ không bảo
  42. 42 đảm tính toàn vẹn dữ liệu nhƣ trong trƣờng hợp thực thể vẫn tồn tại trong hệ con lƣu trữ không gian trong khi đã bị xóa trong RDBMS. Công cụ GIS Giao diện ngƣời dùng Phần mềm DBMS quản lý dữ thƣơng mại liệu CSDL Hình Học CSDL Thuộc Tính Tệp tọa độ Tệp tôpô Bảng thuộc tính Tệp tôpô Hình 4.4: Kiến trúc đối ngẫu của GIS Kiến trúc tầng Kiến trúc tầng lƣu cả dữ liệu không gian trong mô hình dữ liệu quan hệ, khi đó thực thể hình học phải đƣợc bẻ ra làm nhiều phần để lƣu vào các bảng khác nhau. Truy nhập thực thể gốc phải đƣợc thực hiện kết nối các quan hệ, dẫn tới hệ thống chạy chậm và khó sử dụng, để tránh khó khăn ta hình thành giao dịch không gian trong tầng đỉnh của CSDL quan hệ chuẩn. Tầng này có trách nhiệm thông dịch câu lệnh truy vấn hình học thang câu lệnh SQL chuẩn, kết quả sẽ cho truy nhập không gian nhanh hơn nhƣng truy vấn phức tạp hơn. Hệ thông tin địa lý Tầng trợ giúp đối tƣợng không gian Hệ quản trị CSDL quan hệ chuẩn Hình 4.5: Kiến trúc phân tầng của GIS
  43. 43 Kiến trúc tích hợp Phần mở rộng không gian đƣợc tích hợp vào DBMS, khi đó ngôn ngữ truy vấn đƣợc mở rộng bởi khả năng truy vấn các kiểu hình học và các toán tử không gian nhƣ tính toán khoảng cách, giao điểm, chu vi Mô hình GIS kiểu này có hai giải pháp tích hợp là:  Mở rộng quan hệ quản trị dữ liệu thƣơng mại chuẩn cho dữ liệu không gian.  Hệ quản trị CSDL mới theo hƣớng đối tƣợng. Công cụ GIS Công cụ GIS Giao diện ngƣời Giao diện ngƣời dùng dùng Mở rộng Mở rộng DBMS thƣơng mại DBMS tự thiết kế CSDL thuộc tính và CSDL thuộc tính và hình học hình học Tệp đồ họa Tệp đồ họa Tệp tôpô Tệp tôpô Bảng thuộc tính Bảng thuộc tính Hình 4.6. Kiến trúc tích hợp của hệ GIS Câu hỏi ôn tập. 1. Nêu các phƣơng pháp thu thập dữ liệu địa lý. 2. Nêu quá trình số hóa bản đồ. 3. Cho biết các mô hình CSDL ứng dụng trong GIS .
  44. 44 MỘT SỐ ĐỀ THI MẪU
  45. 45 Trƣờng Đại Học Hàng Hải Việt Nam Khoa Công nghệ Thông tin BỘ MÔN HỆ THỐNG THÔNG TIN THI KẾT THÚC HỌC PHẦN Tên học phần: CÁC HỆ THỐNG THÔNG TIN SỐ Đề thi số: Ký duyệt đề: Năm học: x x x Thời gian: 60 phút Câu 1: (2 điểm) GIS là gì. Mục đích và Ứng dụng của GIS? Câu 2: (3 điểm) Trình bày hiểu biết của anh chị về các kỹ thuật thu thập dữ liệu không gian? Câu 3: (3 điểm) Trình bày hiểu biết của anh chị về các hàm kết hợp dữ liệu không gian với các toán tử Vector? Câu 4: (2 điểm) Cho biết quá trình số hóa bản đồ? HẾT Lưu ý: - Không sửa, xóa đề thi, nộp lại đề sau khi thi
  46. 46 Trƣờng Đại Học Hàng Hải Việt Nam Khoa Công nghệ Thông tin BỘ MÔN HỆ THỐNG THÔNG TIN THI KẾT THÚC HỌC PHẦN Tên học phần: CÁC HỆ THỐNG THÔNG TIN SỐ Đề thi số: Ký duyệt đề: Năm học: x x x Thời gian: 60 phút Câu 1: (2 điểm) Cho biết kiến trúc và chức năng của GIS? Câu 2: (3 điểm) Trình bày hiểu biết của anh chị về các hệ tham chiếu không gian? Câu 3: (3 điểm) Trình bày hiểu biết của anh chị về các hàm kết hợp dữ liệu không gian với các toán tử Raster? Câu 4: (2 điểm) Cho biết các hình thức của bản đồ? HẾT Lưu ý: - Không sửa, xóa đề thi, nộp lại đề sau khi thi
  47. 47 Trƣờng Đại Học Hàng Hải Việt Nam Khoa Công nghệ Thông tin BỘ MÔN HỆ THỐNG THÔNG TIN THI KẾT THÚC HỌC PHẦN Tên học phần: CÁC HỆ THỐNG THÔNG TIN SỐ Đề thi số: Ký duyệt đề: Năm học: x x x Thời gian: 60 phút Câu 1: (2 điểm) GIS là gì. Trình bày quá trình tìm kiếm và phân tích không gian? Câu 2: (3 điểm) Trình bày quá trình thu thập dữ liệu, thuận lợi và khó khăn trong quá trình này? Câu 3: (3 điểm) Trình bày mô hình vectơ? Câu 4: (2 điểm) Trình bày quá trình vectơ hóa raster? HẾT Lưu ý: - Không sửa, xóa đề thi, nộp lại đề sau khi thi
  48. 48 Trƣờng Đại Học Hàng Hải Việt Nam Khoa Công nghệ Thông tin BỘ MÔN HỆ THỐNG THÔNG TIN THI KẾT THÚC HỌC PHẦN Tên học phần: CÁC HỆ THỐNG THÔNG TIN SỐ Đề thi số: Ký duyệt đề: Năm học: x x x Thời gian: 60 phút Câu 1: (2 điểm) GIS là gì. Các thành phần của GIS. Câu 2: (3 điểm) Trình bày hiểu biết của anh chị hệ thống phép chiếu UTM? Câu 3: (3 điểm) Trình bày quá trình raster hóa vectơ? Câu 4: (2 điểm) Cho biết các mô hình CSDL trong GIS ? HẾT Lưu ý: - Không sửa, xóa đề thi, nộp lại đề sau khi thi
  49. 49 Trƣờng Đại Học Hàng Hải Việt Nam Khoa Công nghệ Thông tin BỘ MÔN HỆ THỐNG THÔNG TIN THI KẾT THÚC HỌC PHẦN Tên học phần: CÁC HỆ THỐNG THÔNG TIN SỐ Đề thi số: Ký duyệt đề: Năm học: x x x Thời gian: 60 phút Câu 1: (2 điểm) Cho biết kiến trúc và chức năng của GIS? Câu 2: (3 điểm) Trình bày hiểu biết của anh chị về các hệ tham chiếu không gian? Câu 3: (3 điểm) Trình bày cấu trúc Raster? Câu 4: (2 điểm) Trình bày quá trình raster hóa vectơ? HẾT Lưu ý: - Không sửa, xóa đề thi, nộp lại đề sau khi thi