Bài giảng Tin học đại cương - Bài 1: Thông tin và biểu diễn thông tin - Đỗ Bá Lâm

pdf 74 trang ngocly 960
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Tin học đại cương - Bài 1: Thông tin và biểu diễn thông tin - Đỗ Bá Lâm", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_tin_hoc_dai_cuong_bai_1_thong_tin_va_bieu_dien_tho.pdf

Nội dung text: Bài giảng Tin học đại cương - Bài 1: Thông tin và biểu diễn thông tin - Đỗ Bá Lâm

  1. TRƢỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG TIN HỌC ĐẠI CƢƠNG Bài 1: Thông tin và biểu diễn thông tin (5 tiết lý thuyết, 2 tiết bài tập) Đỗ Bá Lâm lamdb-fit@mail.hut.edu.vn Nội dung 1.1. Thông tin và Tin học 1.2. Biểu diễn số trong hệ đếm 1.3. Biểu diễn dữ liệu trong máy tính 2 1
  2. Nội dung 1.1. Thông tin và Tin học 1.1.1. Thông tin và xử lý thông tin 1.1.2. Máy tính điện tử (MTĐT) 1.1.3. Tin học và các ngành liên quan 1.2. Biểu diễn số trong hệ đếm 1.3. Biểu diễn dữ liệu trong máy tính 3 Nội dung 1.1. Thông tin và Tin học 1.1.1. Thông tin và xử lý thông tin 1.1.2. Máy tính điện tử (MTĐT) 1.1.3. Tin học và các ngành liên quan 1.2. Biểu diễn số trong hệ đếm 1.3. Biểu diễn dữ liệu trong máy tính 4 2
  3. a. Thông tin (Information) Thông tin là khái niệm trừu tƣợng, giúp chúng ta hiểu và nhận thức thế giới Dự báo thời tiết Thông tin có thể truyền từ ngƣời này sang ngƣời khác Thời sự 5 b. Dữ liệu (Data) Dữ liệu là vật mang thông tin Dấu hiệu Tín hiệu Cử chỉ, hành vi 6 3
  4. c. Xử lý dữ liệu (Data processing) • Thông tin nằm trong dữ liệu Cần phải xử lý dữ liệu để thu đƣợc thông tin cần thiết, hữu ích phục vụcho con ngƣời • Quá trình xử lý dữ liệu NHẬP XỬ LÝ XUẤT (INPUT) (PROCESSING) (OUTPUT) LƯU TRỮ (STORAGE) c. Xử lý dữ liệu (2) • Khi dữ liệu ít, có thể làm thủ công • Khi dữ liệu nhiều lên, các công việc lặp đi lặp lại ??? Sử dụng máy tính điện tử để hỗ trợ cho việc lƣu trữ, chọn lọc và xử lý dữ liệu. 8 4
  5. Nội dung 1.1. Thông tin và Tin học 1.1.1. Thông tin và xử lý thông tin 1.1.2. Máy tính điện tử (MTĐT) 1.1.3. Tin học và các ngành liên quan 1.2. Biểu diễn số trong hệ đếm 1.3. Biểu diễn dữ liệu trong máy tính 9 1.1.2. Máy tính điện tử • Máy tính điện tử (Computer): – Làm việc không biết chán – Tiết kiệm rất nhiều thời gian, công sức – Tăng độ chính xác trong việc tự động hóa một phần hay toàn phần của quá trình xử lý dữ liệu. 10 5
  6. Máy tính điện tử có mặt ở khắp nơi 11 a. Biểu diễn thông tin trong MTĐT • Trong máy tính mọi thông tin đều đƣợc biểu diễn bằng số nhị phân • Để đƣa dữ liệu vào cho máy tính, cần phải mã hoá nó về dạng nhị phân. • Với các kiểu dữ liệu khác nhau cần có cách mã hoá khác nhau. 12 6
  7. a. Biểu diễn thông tin trong MTĐT (2) • Đơn vị nhỏ nhất để biểu diễn thông tin gọi là bit. • BIT là chữ viết tắt của BInary digiT. • Một bit có 2 trạng thái: 0 hoặc 1 • 0 = OFF ; 1 = ON OFF ON 13 a. Biểu diễn thông tin trong MTĐT (3) • Các đơn vị biểu diễn thông tin lớn hơn: Tên gọi Ký hiệu Giá trị Byte B 8 bit KiloByte KB 210 B = 1024 Byte MegaByte MB 220 B = 1024 KB GigaByte GB 230 B = 1024 MB TeraByte TB 240 B = 1024 GB Petabyte PB 250 B = 1024 TB Exabyte EB 260 B = 1024 PB 14 7
  8. b. Phân loại MTĐT • Theo khả năng sử dụng chung: – Máy tính lớn/Siêu máy tính (Mainframe/Super Computer) – Máy tính tầm trung (Mini Computer) – Máy vi tính ( Micro Computer) 15 i. Máy tính lớn/Siêu máy tính • Phức tạp, có tốc độ rất nhanh • Sử dụng trong các công ty lớn/viện nghiên cứu • Giải quyết các công việc lớn, phức tạp • Rất đắt (hàng trăm ngàn ~ hàng triệu USD). • Nhiều ngƣời dùng đồng thời (100 – 500) 16 8
  9. S u p e r C o m p u t e r ii. Máy tính tầm trung (Mini computer) • Cũng giống nhƣ các máy Mainframe • Sự khác biệt chính: – Hỗ trợ ít ngƣời dùng hơn (10 – 100) – Nhỏ hơn và rẻ hơn (vài chục nghìn USD) 18 9
  10. iii. Máy vi tính (Micro computer) • Sử dụng vi xử lý • Nhỏ, rẻ, hiệu năng cao, • Phù hợp cho nhiều đối tƣợng ngƣời dùng, sử dụng nhiều trong công nghiệp và giải trí: – Máy tính cá nhân – Personal Computer (PC) – Máy tính “nhúng” – Embedded Computer – Các thiết bị cầm tay nhƣ điện thoại di dộng, máy tính bỏ túi – 19 Máy tính cá nhân (Personal Computer – PC) Máy tính để bàn Máy tính bảng Laptop • Máy tính để bàn – Desktop Computer • Máy tính di động – Portable Computer – Máy tính xách tay (Laptop Computer) – Máy tính bỏ túi (PDA - Personal Digital Assistant) • Máy tính bảng – Tablet Computer PDA 10
  11. Máy tính nhúng (Embedded computer) • Là máy tính chuyên dụng (special-purpose computer) • Gắn trong các thiết bị gia dụng, máy công nghiệp • Giúp con ngƣời dùng sử dụng thiết bị hiệu quả hơn 21 c. Các thế hệ máy tính • Sự phát triển về công nghệ Sự phát triển về máy tính 22 11
  12. i. Thế hệ đầu (1950 – 1958) Bóng đèn chân không (vacumm tube) • 1930’s: Bóng đèn được sử dụng làm các bảng mạch tín hiệu điều khiển (electric circuits or switches) • Điều khiển bằng tay, kích thước rất lớn 23 ENIAC ENIAC - Electronic Numerical Integrator and Calculator • Máy tính điện tử đầu tiên với công nghệ bóng chân không: • Kích thước: dài 10m, rộng 3m, cao 3m • Trong 1 giây thực hiện được 3 phép toán 24 12
  13. UNIVAC 1 UNIVAC I - UNIVersal Automatic Computer • Là máy tính thương mại đầu tiên • Thực hiện 30000 phép toán / 1 giây 25 ii. Thế hệ thứ hai (1958 – 1964) Công nghệ bán dẫn (diodes, transistors) • 1947: Bóng bán dẫn được phát minh tại Bell Laboratories • Bóng bán dẫn được sử dụng thay bóng đèn chân không 26 13
  14. TRADIC TRADIC - TRAnsistorized Airborne DIgital Computer • Máy tính đầu tiên sử dụng hoàn toàn bóng bán dẫn: • 8000 transistors • Nhanh hơn • Nhỏ hơn • Rẻ hơn. 27 iii. Thế hệ thứ ba (1965 – 1974) Công nghệ mạch tích hợp (IC – integrated circuit) • 1959 – thiết kế ra vi mạch đầu tiên dựa trên công nghệ silicon (silicon chip or microchip) • Trên 1 vi mạch tích hợp hàng triệu transitor 28 14
  15. Vi mạch – Integrated Circuit • Nhỏ hơn, • Rẻ hơn, • Hiệu quả hơn 29 IBM 360 • Thiết kế trên công nghệ IC • Tốc độ tính toán: 1000 tỷ phép toán trong 1 giây 30 15
  16. iv. Thế hệ thứ tƣ (1974 – nay) Vi xử lý (Microprocessor) • Microprocessor = Central Processing Unit (CPU) thiết kế trong 1 vi mạch đơn • 1971 : Intel 4004 31 1975 – Altair 8800 Máy tính cá nhân đầu tiên – Altair 8800 32 16
  17. Vi xử lý (Microprocessor) 33 1981 – IBM PC Thế hệ máy tính cá nhân mới với kiến trúc mở IBM 34 17
  18. 1984 – Apple Macintos 35 1990 - Personal Computers • Tốc độ vi xử lý tăng nhanh: • CPU 1 lõi, • CPU đa lõi • Kiến trúc ít thay đổi 36 18
  19. Thế hệ thứ tư (tiếp) L Pocket a p t o p Máy tính để bàn Thế hệ thứ tư (tiếp) Pentium 38 19
  20. Pro III IV More Pentium 39 Thế hệ thứ tư (tiếp) Itanium 64-bit Intel Microprocessors 40 20
  21. Thế hệ thứ tư (tiếp) N e t w o r k e. Thế hệ 5 (1990 - nay) • Artificial Intelligence (AI) • Công nghệ vi điện tử với tốc độ tính toán cao và xử lý song song. • Mô phỏng các hoạt động của não bộ và hành vi con ngƣời • Có trí khôn nhân tạo với khả năng tự suy diễn phát triển các tình huống nhận đƣợc 21
  22. Xu hƣớng ngày nay • Nhanh hơn • Nhỏ hơn • Rẻ hơn • Dễ sử dụng hơn 43 Nội dung 1.1. Thông tin và Tin học 1.1.1. Thông tin và xử lý thông tin 1.1.2. Máy tính điện tử (MTĐT) 1.1.3. Tin học và các ngành liên quan 1.2. Biểu diễn số trong hệ đếm 1.3. Biểu diễn dữ liệu trong máy tính 44 22
  23. 1.1.3. Tin học và các ngành liên quan • Tin học (Computer Science/Informatics) • Công nghệ thông tin (Information Technology - IT) • Công nghệ thông tin và truyền thông (Information and Communication Technology – ICT). a. Tin học (Informatics) • 1957, Karl Steinbuch ngƣời Đức đề xƣớng trong 1 bài báo có thuật ngữ "Informatik " • 1962, Philippe Dreyfus ngƣời Pháp gọi là “informatique " • Phần lớn các nƣớc Tây Âu, trừ Anh đều chấp nhận. Ở Anh ngƣời ta sử dụng thuật ngữ „computer science‟, hay „computing science‟, • 1966, Nga cũng sử dụng tên informatika 46 23
  24. a. Tin học (2) • Tin học đƣợc xem là ngành khoa học nghiên cứu các phƣơng pháp, công nghệ và kỹ thuật xử lý thông tin một cách tự động. • Công cụ chủ yếu sử dụng trong tin học là máy tính điện tử và một số thiết bị truyền tin khác. • Nội dung nghiên cứu của tin học chủ yếu gồm 2 phần: – Kỹ thuật phần cứng (Hardware engineering) – Kỹ thuật phần mềm (Software engineering) 47 b. Công nghệ thông tin • Xuất hiện ở Việt nam vào những năm 90 của thế kỷ 20. • CNTT xử lý với các máy tính điện tử và các phần mềm máy tính nhằm chuyển đổi, lưu trữ, bảo vệ, truyền tin và trích rút thông tin một cách an toàn. (Information Technology Association of America) 48 24
  25. b. Công nghệ thông tin (2) • Một ngành sử dụng hệ thống các thiết bị và máy tính, bao gồm phần cứng và phần mềm để cung cấp một giải pháp xử lý thông tin cho các cá nhân, tổch ức có yêu cầu • Có ảnh hƣởng và đƣợc ứng dụng trong nhiều ngành nghề khác nhau của xã hội • Các ứng dụng ngày nay của IT: – Quản trị dữ liệu – Quản lý hệ thống thông tin – Thiết kế sản phẩm – Ứng dụng khoa học 49 c. Công nghệ thông tin và truyền thông (ICT) • Information and Communication Technology – Truyền thông máy tính là sự kết nối một số lƣợng máy tính với nhau • Là thuật ngữ mới, nhấn mạnh sự không thể tách rời hiện nay của CNTT với công nghệ truyền thông trong thời đại “tất cả đều nối mạng” • Internet - Mạng máy tính toàn cầu 50 25
  26. Nội dung 1.1. Thông tin và Tin học 1.2. Biểu diễn số trong hệ đếm 1.2.1. Hệ đếm 1.2.2. Chuyển đổi cơ số 1.3. Biểu diễn dữ liệu trong máy tính 51 Nội dung 1.1. Thông tin và Tin học 1.2. Biểu diễn số trong hệ đếm 1.2.1. Hệ đếm 1.2.2. Chuyển đổi cơ số 1.3. Biểu diễn dữ liệu trong máy tính 52 26
  27. 1.2.1. Hệ đếm • Là tập hợp các ký hiệu và qui tắc để biểu diễn và xác định giá trị các số. • Mỗi hệ đếm có một số ký tự/số (ký số) hữu hạn. Tổng số ký số của mỗi hệ đếm đƣợc gọi là cơ số (base hay radix), ký hiệu là b. • Ví dụ: Trong hệ đếm cơ số 10, dùng 10 ký tự là: các chữ số từ 0 đến 9. 53 1.2.1. Hệ đếm (2) • Về mặt toán học, ta có thể biểu diễn 1 số theo hệ đếm cơ số bất kì. • Khi nghiên cứu về máy tính, ta quan tâm đến các hệ đếm sau đây: – Hệ thập phân (Decimal System) → con ngƣời sử dụng – Hệ nhị phân (Binary System) → máy tính sử dụng – Hệ đếm bát phân (Octal System), hệ mƣời sáu (Hexadecimal System) →dùng để viết gọn số nhị phân 54 27
  28. a. Hệ đếm thập phân • Hệ đếm thập phân hay hệ đếm cơ số 10 bao gồm 10 ký số theo ký hiệu sau: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 • Dùng n chữ số thập phân có thể biểu diễn đƣợc 10n giá trị khác nhau: • 00 000 = 0 • • 99 999 = 10n-1 55 a. Hệ đếm thập phân (2) • Giả sử một số A đƣợc biểu diễn dƣới dạng: A = an an-1 a1 a0 . a-1 a-2 a-m Giá trị của A đƣợc hiểu nhƣ sau: n n 1 1 0 1 m A an10 a n 1 10 a 1 10 a 0 10 a 1 10 a m 10 n i Aa  i10 im 56 28
  29. a. Hệ đếm thập phân (3) • Ví dụ: Số 5246 có giá trị đƣợc tính nhƣ sau: 5246 = 5 x 103 + 2 x 102 + 4 x 101 + 6 x 100 • Ví dụ: Số 254.68 có giá trị đƣợc tính nhƣ sau: 254.68 = 2 x 102 + 5 x 101 + 4 x 100 + 6 x 10-1 + 8 x 10-2 57 b. Hệ đếm cơ số b (với b ≥ 2, nguyên) • Có b ký tự để thể hiện giá trị số. Ký số nhỏ nhất là 0 và lớn nhất là b-1. • Số N(b) trong hệ đếm cơ số (b) đƣợc biểu diễn bởi: N(b)=anan-1an-2 a1a0.a-1a-2 a-m 58 29
  30. b. Hệ đếm cơ số b (2) • Trong biểu diễn trên, số N(b) có n+1 ký số biểu diễn cho phần nguyên và m ký số lẻ biểu diễn cho phần lẻ, và có giá trị là: 59 c. Hệ đếm nhị phân • Sử dụng 2 chữ số: 0,1 • Chữ số nhị phân gọi là bit (binary digit) Ví dụ: Bit 0, bit 1 • Bit là đơn vị thông tin nhỏ nhất 60 30
  31. c. Hệ đếm nhị phân (2) • Dùng n bit có thể biểu diễn đƣợc 2n giá trị khác nhau: 00 000 (2) = 0 (trong hệ thập phân) n 11 111 (2) = 2 - 1 (trong hệ thập phân) • VD: Dùng 3 bit thì biểu diễn đƣợc các số từ 0 đến 7 (trong hệ thập phân) 61 c. Hệ đếm nhị phân (3) • Giả sử có số A đƣợc biểu diễn theo hệ nhị phân nhƣ sau: A = an an-1 a1 a0 . a-1 a-2 a-m • Với ai là các chữ số nhị phân, khi đó giá trị của A là: n n 1 1 0 1 2 m A an2 a n 1 2 a 1 2 a 0 2 a 1 2 a 2 2 a m 2 n i Aa  i 2 im 62 31
  32. c. Hệ đếm nhị phân (4) • Ví dụ: Số nhị phân 1101001.1011 có giá trị: 6 5 3 0 -1 1101001.1011(2) = 2 + 2 + 2 + 2 + 2 + 2-3 + 2-4 = 64 + 32 + 8 + 1 + 0.5 + 0.125 + 0.0625 = 105.6875(10) 63 Tính toán trong hệ nhị phân • Phép cộng: 1+0=0+1=1; 0+0=0; 1+1=10; • Phép trừ: 0-1=1; (vay 1) 1-1=0; 0-0=0; 1-0=1 64 32
  33. Tính toán trong hệ nhị phân – Ví dụ 1 0 1 + 1 1 1 1 1 0 0 65 Tính toán trong hệ nhị phân – Ví dụ 1 1 0 0 - 1 1 1 0 1 0 1 66 33
  34. d. Hệ đếm bát phân (Octal System b=8) • Sử dụng các chữ số:0 ,1,2,3,4,5,6,7 • Dùng n chữ số có thể biểu diễn đƣợc 8n giá trị khác nhau: 00 000 = 0 (trong hệ thập phân) 77 777 = 8n -1 (trong hệ thập phân) 67 d. Hệ đếm bát phân (2) • Giả sử có số A đƣợc biểu diễn theo hệ nhị phân nhƣ sau: A = an an-1 a1 a0 . a-1 a-2 a-m • Với ai là các chữ số trong hệ bát phân, khi đó giá trị của A là: n n 1 1 0 1 2 m A an8 a n 1 8 a 1 8 a 0 8 a 1 8 a 2 8 a m 8 n i Aa  i 8 im 68 34
  35. d. Hệ đếm bát phân (3) • Ví dụ: 235 . 64 (8) có giá trị nhƣ sau: 2 1 0 -1 235 . 64 (8) = 2x8 + 3x8 + 5x8 + 6x8 + 4x8-2 = 157. 8125 (10) 69 e. Hệ đếm 16, Hexadecimal, b=16 • Sử dụng 16 ký số: 0,1,2,3,4,5,6,7,8,9,A,B,C ,D,E,F • Các chữ in: A, B, C, D, E, F biểu diễn các giá trị số tƣơng ứng (trong hệ 10) là 10, 11, 12, 13, 14, 15 70 35
  36. e. Hệ đếm 16 (2) • Giả sử có số A đƣợc biểu diễn theo hệ thập lục phân nhƣ sau: A = an an-1 a1 a0 . a-1 a-2 a-m Với ai là các chữ số trong hệ thập lục phân, khi đó giá trị của A là: n n 1 1 0 1 2 m A an16 a n 1 16 a 1 16 a 0 16 a 1 16 a 2 16 a m 16 n i Aa  i16 im 71 e. Hệ đếm 16 (3) • Ví dụ: 34F5C.12D(16) có giá trị nhƣ sau: 34F5C.12D(16) = 3x164 + 4x163 + 15x162 + 5x161 + 12x160 +? = 216294(10) + ? 72 36
  37. Nội dung 1.1. Thông tin và Tin học 1.2. Biểu diễn số trong hệ đếm 1.2.1. Hệ đếm 1.2.2. Chuyển đổi cơ số 1.3. Biểu diễn dữ liệu trong máy tính 73 1.2.2. Chuyển đổi cơ số • Trƣờng hợp tổng quát, một số N trong hệ thập phân (N(10)) gồm phần nguyên và phần thập phân. • Chuyển 1 số từ hệ thập phân sang 1 số ở hệ cơ số b bất kỳ gồm 2 bƣớc: – Đổi phần nguyên (của số đó) từ hệ thập phân sang hệ b – Đổi phần thập phân (của số đó) từ hệ thập phân sang hệ cơ số b 74 37
  38. a. Chuyển đổi phần nguyên • Bước 1:Lấy phần nguyên của N(10) chia cho b, ta đƣợc thƣơng là T1 số dư d1. • Bước 2: Nếu T1 khác 0, Lấy T1 chia tiếp cho b, ta đƣợc thƣơng số là T2 , số dư là d2 (Cứ làm như vậy cho tới bước thứ n, khi ta được Tn =0) • Bước n: Nếu Tn-1 khác 0, lấy Tn-1 chia cho b, ta đƣợc thƣơng số là Tn =0, số dư là dn • Kết quả ta đƣợc số N(b) là số tạo bởi các số dƣ (được viết theo thứ tự ngược lại) trong các bƣớc trên Phần nguyên của (N 10) = dndn-1 d1 (b) 75 a. Chuyển đổi phần nguyên (2) • Ví dụ: Cách chuyển phần nguyên của số 12.6875(10) sang số trong hệ nhị phân: – Dùng phép chia cho 2 liên tiếp, ta có một loạt các số dƣ nhƣ sau 76 38
  39. b. Chuyển đổi phần thập phân • Bƣớc1: Lấy phần thập phân của N(10) nhân với b, ta đƣợc một số có dạng x1.y1 (x là phần nguyên, y là phần thập phân) • Bƣớc 2: Nếu y1 khác 0, tiếp tục lấy 0.y1 nhân với b, ta đƣợc một số có dạng x2.y2 (cứ làm như vậy cho đến khi yn=0) • Bƣớc n: Nếu yn-1 khác 0, nhân 0.yn-1 với b, ta đƣợc xn.0 • Kết quả ta đƣợc số sau khi chuyển đổi là: Phần thập phân của N(10) = 0.x1x2 xn (b) 77 b. Chuyển đổi phần thập phân (2) • Ví dụ: Cách chuyển phần thập phân của số 12.6875(10) sang hệ nhị phân: 78 39
  40. Ví dụ: Chuyển từ thập phân sang nhị phân • 12.6875(10) = 1100.1011 (2) • 69.25(10) = ?(2) 79 Cách 2: Tính nhẩm • Phân tích số đó thành tổng các lũy thừa của 2, sau đó dựa vào các số mũ để xác định dạng biểu diễn nhị phân Nhanh hơn. • Ví dụ: 69.25(10) = 64 + 4 + 1+ ¼ = 26 + 22 + 20 + 2-2 = 1000101.01(2) 80 40
  41. Một số ví dụ • Nhị phân Hexa: 11 1011 1110 0110(2) = ? – 11 1011 1110 0110(2) = 3BE6(16) • Hexa Nhị phân: AB7(16) = ? – AB7(16) = 1010 1011 0111(2) • Hexa Thập phân: 3A8C ? 3 2 1 3A8C (16) = 3 x 16 + 10 x 16 + 8 x 16 +12 x 160 = 12288 + 2560 + 128 + 12 = 14988(10) 81 Một số ví dụ (tiếp) • Thập phân Hexa: 14988 ? 14988 : 16 = 936 dƣ 12 tức là C 936 : 16 = 58 dƣ 8 58 : 16 = 3 dƣ 10 tức là A 3 : 16 = 0 dƣ 3 Nhƣ vậy, ta có: 14988(10) = 3A8C(16) 82 41
  42. Bài tập • Chuyển sang hệ nhị phân – 124.75 – 65.125 83 Nội dung 1.1. Thông tin và Tin học 1.2. Biểu diễn số trong hệ đếm 1.3. Biểu diễn dữ liệu trong máy tính 1.3.1. Nguyên lý chung 1.3.2. Biểu diễn số nguyên 1.3.3. Biểu diễn số thực 1.3.4. Biểu diễn ký tự 84 42
  43. Nội dung 1.1. Thông tin và Tin học 1.2. Biểu diễn số trong hệ đếm 1.3. Biểu diễn dữ liệu trong máy tính 1.3.1. Nguyên lý chung 1.3.2. Biểu diễn số nguyên 1.3.3. Biểu diễn số thực 1.3.4. Biểu diễn ký tự 85 1.3.1. Nguyên lý chung • Mọi dữ liệu khi đƣa vào máy tính đều phải đƣợc mã hóa thành số nhị phân • Các loại dữ liệu: – Dữ liệu nhân tạo: Do con ngƣời quy ƣớc – Dữ liệu tự nhiên: • Tồn tại khách quan với con ngƣời. • Phổ biến là các tín hiệu vật lý nhƣ âm thanh, hình ảnh, 86 43
  44. a. Nguyên tắc mã hóa dữ liệu • Mã hóa dữ liệu nhân tạo: – Dữ liệu số: Mã hóa theo các chuẩn quy ƣớc – Dữ liệu ký tự: Mã hóa theo bộ mã ký tự • Mã hóa dữ liệu tự nhiên: – Các dữ liệu cần phải số hóa trƣớc khi đƣa vào máy tính – Theo sơ đồ mã hóa và tái tạo tín hiệu vật lý 87 Sơ đồ mã hóa và tái tạo tín hiệu vật lý • Ví dụ: MODEM: MOdulator and DEModulator (Điều chế và Giải điều chế) 88 44
  45. b. Các loại dữ liệu trong máy tính • Dữ liệu cơ bản – Số nguyên: Mã nhị phân thông thƣờng (không dấu) và mã bù hai (có dấu) – Số thực: Số dấu chấm động – Ký tự: Bộ mã ký tự • Dữ liệu có cấu trúc – Là tập hợp các loại dữ liệu cơ bản đƣợc cấu thành theo một cách nào đó. – Ví dụ: Kiểu dữ liệu mảng, xâu ký tự, tập hợp, bản ghi, 89 Nội dung 1.1. Thông tin và Tin học 1.2. Biểu diễn số trong hệ đếm 1.3. Biểu diễn dữ liệu trong máy tính 1.3.1. Nguyên lý chung 1.3.2. Biểu diễn số nguyên 1.3.3. Biểu diễn số thực 1.3.4. Biểu diễn ký tự 90 45
  46. 1.3.2. Biểu diễn số nguyên • Dùng 1 chuỗi bit để biểu diễn. • Đối với số nguyên có dấu, ngƣời ta sử dụng bit đầu tiên(Most significant bit) để biểu diễn dấu „-„ và bit này gọi là bit dấu. * Độ dài từ dữ liệu: – Là số bit được sử dụng để mã hóa loại dữ liệu tương ứng – Trong thực tế, độ dài từ dữ liệu thường là bội số của 8. 91 a. Số nguyên không dấu • Dạng tổng quát: giả sử dùng n bit để biểu diễn cho một số nguyên không dấu A: an-1an-2 a3a2a1a0 • Giá trị của A đƣợc tính nhƣ sau: nn 1 2 1 0 A ann 12 a 2 2 a 1 2 a 0 2 n 1 i Aa  i 2 i 0 • Dải biểu diễn của A: n – Từ 0 đến 2 -1 92 46
  47. Ví dụ 1 • Biểu diễn các số nguyên không dấu sau đây bằng 8 bit: A = 45 B = 156 Giải: A = 45 = 32 + 8 + 4 + 1 = 25 + 23 + 22 + 20 A = 0010 1101(2) B = 156 = 128 + 16 + 8 + 4 = 27 + 24 + 23 + 22 B = 1001 1100 (2) 93 Ví dụ 2 • Cho các số nguyên không dấu X, Y đƣợc biểu diễn bằng 8 bit nhƣ sau: X = 0010 1011 Y = 1001 0110 Giải: X = 0010 1011 = 25 + 23 + 21 + 20 = 32 + 8 + 2 + 1 = 43 Y = 1001 0110 = 27 + 24 + 22 + 21 = 128 + 16 + 4 + 2 = 150 94 47
  48. Trƣờng hợp cụ thể: với n = 8 bit • Dải biểu diễn là [0, 255] . Trục số học máy tính: 0000 0000 = 0 255 0 1 254 2 0000 0001 = 1 3 0000 0010 = 2 0000 0011 = 3 1111 1111 = 255 • Trục số học: 0 1 2 255 95 Với n = 8 bit • 123 + 164 =? • Chú ý trƣờng hợp phép tính vƣợt quá dải biểu diễn 1111 1111 + 0000 0001 1 0000 0000 KQ sai: 255 + 1 = 0 ? (do phép cộng bị nhớ ra ngoài) 96 48
  49. Với n = 16 bit, 32 bit, 64 bit • n = 16 bit: – Dải biểu diễn là [0, 65535] • n = 32 bit: – Dải biểu diễn là [0, 232-1] • n = 64 bit: – Dải biểu diễn là [0, 264-1] 97 b. Biểu diễn số nguyên có dấu • Sử dụng bit đầu tiên để biểu diễn dấu „-„ và bit này gọi là bit dấu • Sử dụng số bù hai để biểu diễn 98 49
  50. i. Phần bù là gì? • U: Universal Set (Tập toàn thể) • A  U • Ac = U \ A 99 ii. Số bù chín và số bù mƣời (hệ thập phân) • Giả sử có 1 số nguyên thập phân A đƣợc biểu diễn bởi n chữ số thập phân. Ta có: – Số bù chín của A = (10n – 1) – A – Số bù mƣời của A =10 n – A – NX: Số bù mƣời = Số bù chín + 1 • Ví dụ: – Xét n = 4 chữ số, A = 2874 – Số bù chín của A = (104 – 1) – 2874 = 7125 – Số bù mƣời của A =10 4 – 2874 = 7126 100 50
  51. iii. Số bù một và số bù hai (hệ nhị phân) • Giả sử có 1 số nguyên nhị phân đƣợc biểu diễn bởi n bit. Ta có: – Số bù một của A = (2n - 1) – A – Số bù hai của A = 2n – A – NX: Số bù hai = Số bù một + 1 • Ví dụ – Xét n = 4 bit, A = 0110 – Số bù một của A = (24 - 1) - 0110 = 1001 – Số bù hai của A = 24 - 0110 = 1010 101 Nhận xét • Ví dụ (cũ) – Xét n = 4 bit, A = 0110 – Số bù một của A = (24 - 1) - 0110 = 1001 – Số bù hai của A = 24 - 0110 = 1010 Có thể tìm số bù một của A bằng cách đảo ngƣợc tất cả các bit Số bù hai = Số bù một + 1 A + Số bù hai của A = 0 nếu bỏ qua bit nhớ ra khỏi bit cao nhất 102 51
  52. iv. Biểu diễn số nguyên có dấu • Biểu diễn số nguyên có dấu bằng số bù hai – Dùng n bit để biểu diễn số nguyên có dấu A – Biểu diễn số bù 2 của A (sử dụng n bit) • Ví dụ: Biểu diễn số nguyên có dấu sau đây bằng 8 bit: A = - 70(10) Biểu diễn 70 = 0100 0110 Bù 1: 1011 1001 (nghịch đảo các bit) + 1 Bù 2: 1011 1010 Vậy: A = 1011 1010(2) 103 iv. Biểu diễn số nguyên có dấu (2) • Dạng tổng quát của số nguyên có dấu A: an-1an-2 a2a1a0 • Giá trị của A đƣợc xác định nhƣ sau: n 2 ni 1 A ani 122  a i 0 • Dải biểu diễn: [-2n-1, 2n-1-1] 10000 000 . 01111 111 • Nhận xét: Với số dƣơng, số âm? 104 52
  53. Ví dụ • Xác định giá trị của các số nguyên có dấu 8 bit sau đây: A = 0101 0110 B = 1101 0010 Giải: A = 26 + 24 + 22 + 21 = 64 + 16 + 4 + 2 = +86 B = -27 + 26 + 24 + 21 = = -128 + 64 + 16 + 2 = -46 105 Trƣờng hợp cụ thể: với n = 8 bit • Dải biểu diễn là [-128, 127] • Trục số học máy tính 0000 0000 = 0 0000 0001 = +1 0000 0010 = +2 01111111 = +127 10000000 = -128 10000001 = -127 1111 1110 = -2 1111 1111 = -1 53
  54. v. Tính toán số học với số nguyên • Cộng/ trừ số nguyên không dấu: – Tiến hành cộng/trừ lần lƣợt từng bít từ phải qua trái. – Khi cộng/trừ hai số nguyên không dấu n bit ta thu đƣợc một số nguyên không dấu n bit. • Nếu tổng của hai số đó lớn hơn 2n-1 thì khi đó sẽ tràn số và kết quả sẽ là sai. • Trừ số không dấu thì ta chỉ trừ đƣợc số lớn cho số nhỏ. Trƣờng hợp ngƣợc lại sẽ sai 107 Ví dụ: Cộng trừ số nguyên không dấu • Dùng 8 bit để biểu diễn số nguyên không dấu • Trƣờng hợp không xảy ra tràn số (carry- out): – X = 1001 0110 = 150 – Y = 0001 0011 = 19 – S = 1010 1001 = 169 – Cout = 0 • Trƣờng hợp có xảy ra tràn số (carry-out): – X = 1100 0101 = 197 – Y = 0100 0110 = 70 – S = 0000 1011 267 – Cout = 1 carry-out – (KQ sai = 23 + 21 + 20 = 11) 108 54
  55. v. Tính toán số học với số nguyên (2) • Cộng số nguyên có dấu • Cộng lần lƣợt các cặp bit từ phải qua trái, bỏ qua bit nhớ (nếu có). • Cộng hai số khác dấu: kết quả luôn đúng • Cộng hai số cùng dấu: • Nếu tổng nhận đƣợc cùng dấu với 2 số hạng thì kết quả là đúng • Nếu tổng nhận đƣợc khác dấu với 2 số hạng thì đã xảy ra hiện tƣợng tràn số học (overflow) và kết quả nhận đƣợc là sai 109 Ví dụ: Cộng/trừ số nguyên có dấu • VD: không tràn số 110 55
  56. Ví dụ: Cộng/trừ số nguyên có dấu • Có xảy ra tràn số: 111 v. Tính toán số học với số nguyên (3) • Trừ số nguyên có dấu – Để trừ hai số nguyên có dấu X và Y, cần lấy bù hai của Y tức– Y, sau đó cộng X với –Y tức là: X – Y = X + (-Y). – Cộng lần lƣợt các cặp bit từ phải qua trái, bỏ qua bit nhớ (nếu có). – Ví dụ: 112 56
  57. v. Tính toán số học với số nguyên (4) • Nhân/chia số nguyên không dấu – Các bƣớc thực hiện nhƣ trọng hệ 10 – VD: Phép nhân 1011 (11 cơ số 10) x 1101 (13 cơ số 10) 1011 0000 1011 1011 10001111 (143 cơ số 10) 113 v. Tính toán số học với số nguyên (5) • Chía hai số nguyên không dấu 114 57
  58. v. Tính toán số học với số nguyên (6) • Nhân số nguyên có dấu: – Bƣớc 1: Chuyển đổi số nhân và số bị nhân thành số dƣơng tƣơng ứng – Bƣớc 2: Nhân 2 số bằng thuật giải nhân số nguyên không dấu Đƣợc tích 2 số dƣơng – Bƣớc 3: Hiệu chỉnh dấu của tích: • Nếu 2 thừa số ban đầu cùng dấu Kết quả là tích thu đƣợc trong bƣớc 2. • Nếu khác dấu Kết quả là số bù 2 của tích thu đƣợc trong bƣớc 2. 115 v. Tính toán số học với số nguyên (7) • Chia số nguyên có dấu: – Bƣớc 1: Chuyển đổi số chia và số bị chia thành số dƣơng tƣơng ứng – Bƣớc 2: Chia 2 số bằng thuật giải chia số nguyên không dấu Thu đƣợc thƣơng và dƣ đều dƣơng – Bƣớc 3: Hiệu chỉnh dấu của kết quả theo quy tắc sau: 116 58
  59. vi. Tính toán logic với số nhị phân • Các phép toán logic với cặp bit nhị phân: a b a AND b a OR b a XOR b 0 0 0 0 0 0 1 0 1 1 1 0 0 1 1 1 1 1 1 0 117 vi. Tính toán logic với số nhị phân (2) • Các phép toán logic với từng bit nhị phân: a NOT a 0 1 1 0 118 59
  60. vi. Tính toán logic với số nhị phân (3) • Thực hiện các phép toán logic với 2 số nhị phân: – Kết quả là 1 số nhị phân khi thực hiện các phép toán logic với từng cặp bit của 2 số nhị phân đó – Các phép toán này chỉ tác động lên từng cặp bit mà không ảnh hƣởng đến bit khác. 119 Ví dụ: Phép toán với 2 số nhị phân • VD: A = 1010 1010 và B = 0000 111 AND OR XOR NOT 1010 1010 01010101 0000 1111 11110000 00001010 10101111 10100101 Nhận xét: + AND: xoá một số bit và giữ nguyên 1 số bit còn lại + OR: Thiết lập 1 số bit và giữ nguyên 1 số bit còn lại + XOR: Đảo1 số bit và giữ nguyên 1 số bit còn lại + NOT: Đảo tất cả các bit 120 60
  61. Nội dung 1.1. Thông tin và Tin học 1.2. Biểu diễn số trong hệ đếm 1.3. Biểu diễn dữ liệu trong máy tính 1.3.1. Nguyên lý chung 1.3.2. Biểu diễn số nguyên 1.3.3. Biểu diễn số thực 1.3.4. Biểu diễn ký tự 121 a. Nguyên tắc chung • Để biểu diễn số thực, trong máy tính ngƣời ta thƣờng dùng ký pháp dấu chấm động (Floating Point Number) • Ví dụ: 12.3 = 12.3 * 100 = 123 * 101 = 1.23 * 10-1 122 61
  62. a. Nguyên tắc chung (2) • Một số thực X đƣợc biểu diễn theo kiểu số dấu chấm động nhƣ sau: X = M * RE Trong đó: – M là phần định trị (Mantissa) – R là cơ số (Radix) thƣờng là 2 hoặc 10. – E là phần mũ (Exponent) • Với R cố định thì để lƣu trữ X ta chỉ cần lƣu trữ M và E (dƣới dạng số nguyên) 123 Ví dụ - Biểu diễn số thực • Với cơ số R = 10, giả sử 2 số thực N1 và N2 đƣợc lƣu trữ theo phần định trị và số mũ nhƣ sau: – M1 = -15 và E1 = +12 – M2 = +314 và E2 = -9 – Có nghĩa là N1 = M1 x 10 E1 = -15x1012 = -15 000 000 000 000 và N2 = M2 x 10 E2 = 314 x 10-9 = 0.000 000 314 124 62
  63. b. Phép toán với số thực • Khi thực hiện phép toán với số dấu chấm động sẽ đƣợc tiến hành trên cơ sở các giá trị của phần định trị và phần mũ. 125 c. Phép toán với số thực (2) • Giả sử có 2 số dấu phẩy động sau: – N1 = M1 x RE1 và N2 = M2 x RE2 • Khi đó, việc thực hiện các phép toán số học sẽ đƣợc tiến hành: – N1 ± N2 = (M1 x R E1-E2 ± M2) x RE2 , (giả thiết E1 ≥ E2) – N1 x N2 = (M1x M2) x R E1+E2 – N1 /N2 = (M1 / M2) x R E1-E2 126 63
  64. c. Chuẩn IEEE 754/85 • Là chuẩn mã hóa số dấu chấm động • Cơ số R = 2 • Có các dạng cơ bản: – Dạng có độ chính xác đơn, 32-bit – Dạng có độ chính xác kép, 64-bit – Dạng có độ chính xác kép mở rộng, 80-bit 127 c. Chuẩn IEEE 754/85 (2) Khuôn dạng mã hóa: 31 30 23 22 0 S e m 63 62 52 51 0 S e m 79 78 64 63 0 S e m 128 64
  65. c. Chuẩn IEEE 754/85 (3) • S là bit dấu, S=0 đó là số dƣơng, S=1 đó là số âm. • e là mã lệch (excess) của phần mũ E, tức là: E = e – b Trong đó b là độ lệch (bias): – Dạng 32-bit : b = 127, hay E = e - 127 – Dạng 64-bit : b = 1023, hay E = e - 1023 – Dạng 80-bit : b = 16383, hay E = e - 16383 129 c. Chuẩn IEEE 754/85 (4) • m là các bit phần lẻ của phần định trị M, phần định trị đƣợc ngầm định nhƣ sau: M = 1.m • Công thức xác định giá trị của số thực tƣơng ứng là: X = (-1)S x 1.m x 2e-b S e m 130 65
  66. Ví dụ1 • Ví dụ 1: Có một số thực X có dạng biểu diễn nhị phân theo chuẩn IEEE 754 dạng 32 bit nhƣ sau: 1100 0001 0101 0110 0000 0000 0000 0000 Xác định giá trị thập phân của số thực đó. • Giải: – S = 1 X là số âm – e = 1000 0010 = 130 – m = 10101100 00 – Vậy X = (-1)1 x 1.10101100 00 x 2130-127 = -1.101011 x 23 = -1101.011 = -13.375 131 Ví dụ2 • Xác định giá trị thập phân của số thực X có dạng biểu diễn theo chuẩn IEEE 754 dạng 32 bit nhƣ sau: 0011 1111 1000 0000 0000 0000 0000 0000 • Giải: – S = 0 X là số dƣơng – e = 0111 1111= 127 – m = 000000 00 – Vậy X = (-1)0 x 1.0000 00 x 2127-127 = 1.0 x 20 = 1 132 66
  67. Ví dụ 3 • Biểu diễn số thực X = 9.6875 về dạng số dấu chấm động theo chuẩn IEEE 754 dạng 32 bit • Giải: 3 X = 9.6875(10) = 1001.1011(2) = 1.0011011 x 2 Ta có: – S = 0 vì đây là số dƣơng – E = e – 127 nên e = 127 + 3 = 130(10) = 1000 0010(2) – m = 001101100 00 (23 bit) X = 0100 0001 0001 1011 0000 0000 0000 0000 133 Các quy ƣớc đặc biệt • Nếu tất cả các bit của e đều bằng 0, các bit của m đều bằng 0, thì X = 0 • Nếu tất cả các bit của e đều bằng 1, các bit của m đều bằng 0, thì X = • Nếu tất cả các bit của e đều bằng 1, m có ít nhất một bit bằng 1, thì X không phải là số (not a number - NaN) 134 67
  68. Trục số biểu diễn underflow overflow overflow -b -a -0 +0 a b • Dạng 32 bit: a = 2-127 ≈ 10-38 b = 2+127 ≈ 10+38 • Dạng 64 bit: a = 2-1023 ≈ 10-308 b = 2+1023 ≈ 10+308 • Dạng 80 bit: a = 2-16383 ≈ 10-4932 b = 2+16383 ≈ 10+4932 135 Nội dung 1.1. Thông tin và Tin học 1.2. Biểu diễn số trong hệ đếm 1.3. Biểu diễn dữ liệu trong máy tính 1.3.1. Nguyên lý chung 1.3.2. Biểu diễn số nguyên 1.3.3. Biểu diễn số thực 1.3.4. Biểu diễn ký tự 136 68
  69. a. Nguyên tắc chung • Các ký tự cũng cần đƣợc chuyển đổi thành chuỗi bit nhị phân gọi là mã ký tự. • Số bit dùng cho mỗi ký tự theo các mã khác nhau là khác nhau. VD: Bộ mã ASCII dùng 8 bit cho 1 ký tự. Bộ mã Unicode dùng 16 bit. 137 a. Bộ mã ASCII • Do ANSI (American National Standard Institute) thiết kế • ASCII là bộ mã đƣợc dùng để trao đổi thông tin chuẩn của Mỹ. Lúc đầu chỉ dùng 7 bit (128 ký tự) sau đó mở rộng cho 8 bit và có thể biểu diễn 256 ký tự khác nhau trong máy tính • Bộ mã 8 bit mã hóa đƣợc cho 28 = 256 kí tự, có mã từ 00(16)  FF(16), bao gồm: – 128 kí tự chuẩn có mã từ 00(16)  7F(16) – 128 kí tự mở rộng có mã từ 80(16)  FF(16) 138 69
  70. i. Ký tự chuẩn – Bộ mã ASCII • 95 kí tự hiển thị đƣợc: Có mã từ 20(16) † 7E(16) – 26 chữ cái hoa Latin 'A' † 'Z' có mã từ 41(16) † 5A(16) – 26 chữ cái thƣờng Latin 'a' † 'z' có mã từ 61(16) † 7A(16) – 10 chữ số thập phân '0' † '9' có mã từ 30(16) † 39(16) – Các dấu câu: . , ? ! : ; – Các dấu phép toán: + - * / – Một số kí tự thông dụng: #, $, &, @, – Dấu cách (mã là 20(16)) • 33 mã điều khiển: mã từ 0016 † 1F16 và 7F16 dùng để mã hóa cho các chức năng điều khiển 139 140 70
  71. Ký tự điều khiển định dạng BS Backspace - Lùi lại một vị trí: Ký tự điều khiển con trỏ lùi lại một vị trí. HT Horizontal Tab - Tab ngang: Ký tự điều khiển con trỏ dịch tiếp một khoảng đã định trước. LF Line Feed - Xuống một dòng: Ký tự điều khiển con trỏ chuyển xuống dòng dưới. VT Vertical Tab - Tab đứng: Ký tự điều khiển con trỏ chuyển qua một số dòng đã định trước. FF Form Feed - Đẩy sang đầu trang: Ký tự điều khiển con trỏ di chuyển xuống đầu trang tiếp theo. CR Carriage Return - Về đầu dòng: Ký tự điều khiển con trỏ di chuyển về đầu dòng hiện hành. 141 Ký tự điều khiển truyền số liệu SOH Start of Heading - Bắt đầu tiêu đề: Ký tự đánh dấu bắt đầu phần thông tin tiêu đề. STX Start of Text - Bắt đầu văn bản: Ký tự đánh dấu bắt đầu khối dữ liệu văn bản và cũng chính là để kết thúc phần thông tin tiêu đề. ETX End of Text - Kết thúc văn bản: Ký tự đánh dấu kết thúc khối dữ liệu văn bản đã được bắt đầu bằng STX. EOT End of Transmission - Kết thúc truyền: Chỉ ra cho bên thu biết kết thúc truyền. ENQ Enquiry - Hỏi: Tín hiệu yêu cầu đáp ứng từ một máy ở xa. ACK Acknowledge - Báo nhận: Ký tự được phát ra từ phía thu báo cho phía phát biết rằng dữ liệu đã được nhận thành công. NAK Negative Aknowledge - Báo phủ nhận: Ký tự được phát ra từ phía thu báo cho phía phát biết rằng việc nhận dữ liệu không thành công. SYN Synchronous / Idle - Đồng bộ hóa: Được sử dụng bởi hệ thống truyền đồng bộ để đồng bộ hoá quá trình truyền dữ liệu. ETB End of Transmission Block - Kết thúc khối truyền: Chỉ ra kết thúc khối dữ liệu được truyền. 142 71
  72. Ký tự điều khiển phân cách thông tin FS File Separator - Ký hiệu phân cách tập tin: Đánh dấu ranh giới giữa các tập tin. GS Group Separator - Ký hiệu phân cách nhóm: Đánh dấu ranh giới giữa các nhóm tin (tập hợp các bản ghi). RS Record Separator - Ký hiệu phân cách bản ghi: Đánh dấu ranh giới giữa các bản ghi. US Unit Separator - Ký hiệu phân cách đơn vị: Đánh dấu ranh giới giữa các phần của bản ghi. 143 Các ký tự điều khiển khác NUL Null - Ký tự rỗng: Được sử dụng để điền khoảng trống khi không có dữ liệu. BEL Bell - Chuông: Được sử dụng phát ra tiếng bíp khi cần gọi sự chú ý của con người. SO Shift Out - Dịch ra: Chỉ ra rằng các mã tiếp theo sẽ nằm ngoài tập ký tự chuẩn cho đến khi gặp ký tự SI. SI Shift In - Dịch vào: Chỉ ra rằng các mã tiếp theo sẽ nằm trong tập ký tự chuẩn. DLE Data Link Escape - Thoát liên kết dữ liệu: Ký tự sẽ thay đổi ý nghĩa của một hoặc nhiều ký tự liên tiếp sau đó. DC1 ÷ Device Control - Điều khiển thiết bị : Các ký tự dùng để điều khiển các thiết bị DC4 phụ trợ. CAN Cancel - Hủy bỏ: Chỉ ra rằng một số ký tự nằm trước nó cần phải bỏ qua. EM End of Medium - Kết thúc phương tiện: Chỉ ra ký tự ngay trước nó là ký tự cuối cùng có tác dụng với phương tiện vật lý. SUB Substitute - Thay thế: Được thay thế cho ký tự nào được xác định là bị lỗi. ESC Escape - Thoát: Ký tự được dùng để cung cấp các mã mở rộng bằng cách kết hợp với ký tự sau đó. DEL Delete - Xóa: Dùng để xóa các ký tự không mong muốn. 144 72
  73. b. Ký tự mở rộng – Bộ mã ASCII • Đƣợc định nghĩa bởi: – Nhà chế tạo máy tính – Ngƣời phát triển phần mềm • Ví dụ: – Bộ mã ký tự mở rộng của IBM: đƣợc dùng trên máy tính IBM-PC. – Bộ mã ký tự mở rộng của Apple: đƣợc dùng trên máy tính Macintosh. – Các nhà phát triển phần mềm tiếng Việt cũng đã thay đổi phần này để mã hoá cho các ký tự riêng của chữ Việt, ví dụ nhƣ bộ mã TCVN 5712. 145 c. Bộ mã Unicode • Do các hãng máy tính hàng đầu thiết kế • Là bộ mã 16-bit, Vậy số ký tự có thể biểu diễn (mã hoá) là 216 • Đƣợc thiết kế cho đa ngôn ngữ, trong đó có tiếng Việt 146 73
  74. Thảo luận 147 74