Giáo trình Truyền thông đa phương tiện

pdf 60 trang ngocly 2620
Bạn đang xem 20 trang mẫu của tài liệu "Giáo trình Truyền thông đa phương tiện", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfgiao_trinh_truyen_thong_da_phuong_tien.pdf

Nội dung text: Giáo trình Truyền thông đa phương tiện

  1. MỤC LỤC Trang MỤC LỤC 1 Trang 1 Lời nói đầu 2 CHƯƠNG 1. GIỚI THIỆU CHUNG VỀ TRUYỀN THÔNG ĐA PHƯƠNG TIỆN 3 1.1. Thông tin trong đời sống hiện đại 3 1.2. Các khái niệm cơ bản 3 1.2.1. Thế nào là phương tiện? 3 1.2.2. Truyền thông đa phương tiện là gì? 4 1.2.3. Thế nào là một hệ truyền thông đa phương tiện? 4 1.2.4. Tính tương tác của các chương trình truyền thông đa phương tiện 4 1.2.5. Phương tiện mới 5 1.3. Thông tin đa lớp, đa chiều 6 1.4. Các chuẩn Mutimedia thông dụng 7 1.4.1. Chuẩn dành cho kiến trúc tài liệu 7 1.4.2. Chuẩn dành cho tương tác 8 1.4.3. Framework và mô hình tham chiếu 9 CHƯƠNG II. ỨNG DỤNG CỦA ĐA PHƯƠNG TIỆN TRONG ĐỜI SỐNG 10 2.1. Truyền thông đa phương tiện trong đào tạo và giáo dục. 10 2.1.1. giới thiệu chung 10 2.1.2. Phát triển E-learning trong đào tạo từ xa 12 2.1.3. Cấu trúc của một hệ thống E- learning điển hình 18 2.1.4. Kết luận 21 2.2. Truyền thông đa phương tiện trong thông tin và bán hàng 23 2.3. Truyền thông đa phương tiện trong y học 25 2.4. Truyền thông đa phương tiện trong gia đình 29 CHƯƠNG III. CÁC YÊU CẦU CỦA HỆ THỐNG ĐA PHƯƠNG TIỆN 31 3.1. Yêu cầu của ứng dụng đa phương tiện trên máy đơn 31 3.2. Chất lượng dịch vụ trong các hệ thống Multimedia 32 CHƯƠNG IV. MỘT SỐ DỮ LIỆU ĐA PHƯƠNG TIỆN 36 4.1. Ảnh 36 4.1.1. Ảnh và ứng dụng 36 4.1.2. Thu ảnh 37 4.1.3. Kĩ thuật nén 37 4.1.3. Nén Fractal 39 4.2. Âm thanh 41 4.2.1. Các ứng dụng âm thanh 41 4.2.3. Kĩ thuật nén 42 4.3. Video 43 4.3. 1. Các ứng dụng video 43 4.3.2. Nén video 43 CHƯƠNG V. XÂY DỰNG ỨNG DỤNG ĐA PHƯƠNG TIỆN 49 5.1. Các yêu khi xây dựng một ứng dụng đa phương tiện 49 5.2. Các thành viên tham gia dự án 49 5.3. Các bước xây dựng ứng dụng đa phương tiện 50 5.3.1. Xác định đối tượng người xem 51 5.3.2. Sơ đồ thiết kế của các đối tượng multimedia 52 5.3.3. Thiết kế và viết kịch bản 54 5.3.4. Chọn các công cụ, tạo ra thông tin và sáng tạo 55 5.3.5. Kiểm thử 57 5.3.6. Phân phối thông tin truyền thông đa phương tiện 58
  2. Lời Nói Đầu Trong vòng vài năm trở lại dây chúng ta nghe nói rất nhiều dấn từ multimedia. Vậy, một cách chính xác, multimedia là gì? Từ lâu thuật ngữ media dùng để chỉ các thực thể như là chiếc máy truyền th ảnh. máy truyền hình, nghĩa là không phải nói đến một vật mang thông tin đơn thuần, mà là một hệ thống tương đối phức tạp, có cơ cấu, có đối tượng nhắm tới. Loại truyền thông trực tiếp, từ miệng người này đến tai người kia, không sử dụng thành phần (media) trung gian. Không khí truyền các chấn động âm thanh không phải là một media. mà chỉ là một vật mang vật là làm công việc tái thông tin. Nếu dùng một máy cassette audio để ghi lời của người nói, nội dung trong cassette không thể đến người nghe bằng cách truy xuất trực tiếp, phải nhờ đến một hệ thống vật lý khác: máy đọc cassette. Nếu để rời, cassette này chỉ được xem là một vật mang. Nếu gộp cùng máy đọc cassette. thì đấy là một hệ thống truyền thông, một media. Media có mục đích là phát, truyền thông tin. không đòi hỏi chỉ bằng cách nghe và nhìn. Một tờ giấy in chữ nổi cho người mù. đòi hỏi sự sờ mó. Một tấm chức postalc có nhạc và mùi hương, đòi hỏi cùng lúc sự nhìn, nghe và ngửi. Bằng chừng ấy, chúng ta có thể nói đến một sự truyền thông đa phương tiện. Và như vật, từ multimedia xuất hiện kèm với nhiều d ảnh từ chung khác: centre de ressource multimedia (trung tâm tài nguyên đa phương tiện), post de formation multimedia (trạm đào tạo đa phương tiện), multimedia training (huấn luyện bằng đa phương tiện), multimedia personal computer MDC (máy tính cá nhân với đa phương tiện), digital multimedia system (hệ thống đa phương tiện dạng số ). Trong nội dung môn học này chúng ta sẽ nghiên cứu các khái niệm cơ bản về Multimedia. hiểu được các ứng dụng rỗng rãi của Multimedia trong đời sống: các yêu cầu và xu hướng phát triển ứng dụng hiện nay của Multimedia, các cấu trúc thiết kế ứng dụng và các bước cần thiết để xây dựng ứng dụng đa phương tiện, nắm bắt được một số công cụ có sẵn trong thực tế để thiết kế các ứng dụng Multimedia.
  3. CHƯƠNG 1 GIỚI THIỆU CHUNG VỀ TRUYỀN THÔNG ĐA PHƯƠNG TIỆN. 1.1. Thông tin trong đời sống hiện đại Khi công nghệ phát triển, người tiêu dùng ngày càng đòi hỏi khắt khe hơn. Trong thời đại của thông tin tốc độ cao, chúng ta mong muốn nhận được các thông tin ngay tức thì và đồng thời, thông qua nhiều cách thức khác nhau. Nhu cầu này giải thích tại sao các kênh tin tức trên truyền hình thường xuyên có các dòng chữ chạy phía dưới màn hình trong khi phát th ảnh viên nói và các hình ảnh đã thâu băng trước đó trôi qua. Nhu cầu đó giải thích tại sao các website ngày nay ngoài nội dung và các siêu liên kết còn gồm thêm các hình ảnh đồ hoạ, hoạt ảnh và âm thanh. Những nhu cầu này đã mở rộng cách chúng ta làm việc, học tập và giải trí. Nói một cách đơn giản, các thông tin “một chiều” không còn phù hợp với hầu hết chúng ta nữa. Thông tin, các bài học, trò chơi và mua sắm sẽ lôi cuốn hơn là khiến chúng ta chú ý hơn nếu chúng ta có thể tiếp cận và sắp xếp chúng trong các cách thức khác nhau, thậm chí theo một ý thích nào đó mà chúng ta chợt nảy ra. Những nhu cầu này và các tiến bộ về công nghệ đã tương quan mật thiết với nhau để đưa nghệ thuật và khoa học truyền thông đa phương tiện lên một tầm cao mới, dẫn đến kết quả là các sản phẩm có khả năng đan kết văn bản, hình ảnh đồ hoạ, hoạt ảnh, âm thanh và video. Khi chúng ta sử dụng các sản phẩm này - cho dù là một bộ bách khoa toàn thư trên web hay một trò chơi video trên CD - thì có nghĩa là chúng ta không đơn thuần chỉ làm việc với một chương trình máy tính. Chúng ta đã trải nghiệm qua một sự kiện truyền thông đa phương tiện. Các sản phẩm truyền thông đa phương tiện ngày nay đều thu hút nhiều giác quan cùng một lúc và đáp ứng với nhu cầu thay đổi của chúng ta với tốc độ ngày càng gia tăng. Phần dưới đây sẽ giới thiệu cho các bạn các khái niệm cơ bản về truyền thông đa phương tiện và giải thích cách hoạt động của các yếu tố truyền thông đa phương tiện. 1.2. Các khái niệm cơ bản 1.2.1. Thế nào là phương tiện? Trong suốt chiều dài lịch sứ, thông tin đã được chuyển tải thông qua một phương tiện duy nhất. Âm thanh, chẳng hạn như giọng nói của con người, chính là một loại phương tiện đó và qua nhiều thế kỉ trước khi chữ viết được sử dụng rộng rãi thì nói chuyện là một cách thức chủ yếu dễ trao đổi thông tin. Sau này con người bắt đầu kể chuyện và để lại thông tin về cuộc sống của mình thông qua các hình vẽ, các bức tr ảnh. Sự ra đời của chữ viết đã cho con người một phương tiện khác nữa để diễn đạt ý nghĩ của mình. Ngày nay, con người thường sử dụng lời nói, âm thanh, âm nhạc, văn bản, hình ảnh, đồ hoạ, hoạt ảnh và video để truyền tải thông tin. Những thứ này là tất cả các loại phương tiện khác nhau (thuật ngữ media là số
  4. nhiều của medium) và mỗi phương tiện thường được dùng để biểu đạt các loại thông tin nhất định. Như vậy trong ý nghĩa này, phương tiện chỉ đơn giản là một cách thức dễ truyền đạt thông tin. 1.2.2. Truyền thông đa phương tiện là gì? Kể từ lâu con người đã khám phá ra rằng các thông điệp sẽ trở nên tác động hơn (có nghĩa là người nghe sẽ hiểu và nhớ chúng dễ hơn) khi chúng được biểu đạt thông qua một kết hợp của các phương tiện khác nhau. Loại kết hợp này chính là ý nghĩa của thuật ngữ truyền thông đa phương tiện. Truyền thông đa phương tiện là sử dụng nhiều hơn một loại phương tiện vào cùng một thời điểm Ví dụ: • Giáo viên sử dụng bảng đen trong lớp học để viết các lời giải thích cho bài giảng của họ. • Sử dụng phim ảnh, truyền hình kết hợp nhiều loại phương tiện (âm thanh, video, hoạt ảnh, hình ảnh tĩnh và chữ) để tạo ra nhiều loại thông điệp khác nhau có khả năng cung cấp thông tin và sự tiêu khiển cho mọi người theo những cách thức độc nhất là đầy ý nghĩa. 1.2.3. Thế nào là một hệ truyền thông đa phương tiện? Các hệ thống thông tin đa phương tiện dùng nhiều phương tiện giao tiếp khác nhau (văn bản, dữ liệu ghi, dữ liệu số. đồ hoạ, hình ảnh, âm thanh, video ). Nhiều ứng dụng là đa phương tiện theo ý nghĩa là chúng dùng nhiều dạng trên. Tuy nhiên, thuật ngữ "đa phương tiện” thường được dùng để mô tả các hệ thống phức tạp hơn. nhất là các hệ thống hỗ trợ hình ảnh và âm thanh. Các thông tin mới chủ yếu được tạo ra bên ngoài máy tính. Lời nói, nhạc, hình ảnh và phim được chuyển từ dạng Analog (tương tự) sang Digital (số) trước khi được dùng trong các ứng dụng trong máy tính. Ngược lại, với văn bản, đồ hoạ và thậm chí phim hoạt hình đều được tạo trên máy tính và vì vậy nó chỉ đáp ứng những mục tiêu nhất định, không thể mở rộng ứng dụng được. Một hệ nền máy tính, mạng thông tin hay dụng cụ phần mềm là một hệ đa phương tiện nếu nó hỗ trợ ứng dụng tương tác cho ít nhất là một trong các dạng thông tin sau. không kể văn bản và đồ hoạ: âm thanh, hình ảnh tĩnh hoặc phim video chuyển động. 1.2.4. Tính tương tác của các chương trình truyền thông đa phương tiện Ngày nay, công nghệ máy tính đã đưa các sản phẩm truyền thông đa phương tiện trên PC tiến thêm một bước xa hơn. Không giống như sách, phim hay chương trình truyền hình: máy tính có thể nhận dữ liệu nhập từ người sử dụng. do vậy nó có thể chứa các sự kiện truyền thông đa phương tiện tương tác có bao gồm vai trò người sử dụng. Thuật ngữ tương tác được hiểu là người sử dụng và chương trình phản ứng qua lại với nhau. Chương trình liên tục cung cấp cho người sử dụng một tập các lựa chọn để cho người sử
  5. dụng chọn, nhằm điều khiển các hoạt động của chương trình. Và thậm chí kiểm soát những gì họ thấy và nghe được. Bằng cách nhận vào dữ liệu nhập vào từ người sử dụng, các phương tiện tương tác tạo ra một vòng lặp phản hồi, nói chung hoạt động như sau: • Bắt đầu vòng lặp người sử dụng kích hoạt chương trình tương tác và chọn thông tin cần xem. • Chương trình đáp ứng lại bằng cách hiển thị ra cho người sử dụng thông tin với các lựa chọn. • Người sử dụng đáp ứng bằng cách chọn một lựa chọn. chẳng hạn như di chuyển đến một nơi khác trong chương trình hoặc chọn thông tin khác. • Chương trình đáp ứng với lựa chọn của người sử dụng và thường đưa ra một tập các tuỳ chọn mới. • Quá trình tiếp diễn - đôi khi nhịp độ rất nhanh và phức tạp như trong nhiều trò chơi máy tính: cho tới khi người sử dụng ngừng chương trình. Như vậy, các chương trình truytền thông đa phương tiện được mô tả là có tính tương tác nếu chúng nhận dữ liệu nhập từ người sử dụng và cho phép người sử dụng điều khiển dòng chảy thông tin hoặc hoạt động của chương trình. 1.2.5. Phương tiện mới Tương tác không chỉ liên quan đến một máy tính là một con chuột. Phương tiện mới (một thuật ngữ bao gồm tất cả các loại công nghệ truyền thông đa phương tiện tương tác) có thể kết hợp nhiều công nghệ truyền thông khác nhau chẳng hạn như truyền hình cáp, các dường dây điện thoại. các mạng riêng, mạng Internet và các công nghệ khác. Phương tiện mới được tạo ra như một sự hội tụ nhiều loại công nghệ, cho phép các cá nhân riêng le cũng như các tổ chức lớn giao tiếp và truyền đạt thông tin bằng cách sử dụng máy tính và các hệ thống truyền thông. Phần cốt lõi của phương tiện mới là một khái niệm được gọi là sự hội tụ kỹ thuật số. Người ta dùng các máy tính để tạo ra các loại thông tin kỹ thuật số khác nhau, từ loại chỉ thuần là văn bản đến thông tin video. Tất cả những loại thông tin kỹ thuật số này có thể chuyển đến người sử dụng theo cùng một con đường - có thể là qua một đĩa CD-ROM. một đường dây truyền hình cáp hay qua đường vệ tinh. Thay vì phải chuyền tải phim ảnh trong các trong các băng hình hay băng video, chuyển tải âm nhạc trên các băng nhạc hay đi và compact và chuyển tải sách bằng các trang in giờ đây ta có thể chuyển tải các loại thông tin khác nhau đến các máy tính hay hộp truyền hình cáp với cùng một cách thức. Do vậy. ta có một tập hợp các thông tin kết hợp với nhau và hội tụ vào một luồng thông tin kỹ thuật số. Đối với người sử dụng. công nghệ này có nghĩa là thông tin truyền thông đa phương tiện có thể được lưu trữ và chuyển tải theo nhiều cách. Nếu bạn sử dụng PC. thông tin truyền thông đa phương tiện có thể có trong một đĩa compact, một đĩaVCD, đĩa cứng, mạnt Internet hay một dịch vụ trực tuyến. Nếu bạn sử dụng các đặc tính thu tín hiệu truyền hình trong Windows 98. Windows 2000 bạn còn có thể nhận được các thông tin như trên ở dạng thức chương trình phát hình được chuyển đến màn hình của bạn. Nếu bạn sử dụng một dịch vụ chẳng hạn như WebTV, bạn có thể sử dụng đồng thời các chương trình phát hình và thông tin
  6. lnternet. Tuỳ theo công nghệ được dùng, một số các sự kiện truyền thông đa phương tiện là những ứng dụng một người sử dụng và chạy đơn độc chẳng hạn như một quyển sách tham khảo hay một chương trình dạy học trên CD-ROM. Các sự kiện khác có thể liên quan nhiều hơn đến một người sử dụng. Ví dụ như các trò chơi nhiều người có thể được truy xuất thông qua một mạng cục bộ hay mạng Internet, các cuộc hội thảo video cho phép những người tham gia nhìn thấy nhau và chia sẻ dữ liệu trong thời gian thực thông qua đường dây điện thoại hay các kết nối vệ tinh hoặc các chương trình truyền hình tương tác nhận các dữ liệu người sử dụng thông qua một Website hay một phòng tán gẫu trên Web. 1.3. Thông tin đa lớp, đa chiều Các nhà phát triển truyền thông đa phương tiện liên tục cố gắng để tìm ra cách thức làm cho sản phẩm của họ lôi cuốn người sử dụng hơn cho dù sản phẩm đó là một trò chơi hành động nhịp độ cao hay một bản hướng dẫn trên dĩa hoặc một website thương mại điện tử. Một chiến lược cơ bản trong việc phát triển thông tin truyền thông đa phương tiện là cung cấp thông tin được sắp thành lớp và thông tin đa chiều. Yêu cầu này có nghĩa là sản phẩm phải cung cấp cho người sử dụng các mảnh thông tin một cách đồng thời, chẳng hạn như một hình ảnh 3 chiều đang quay tròn của một mô tơ, một đoạn âm thanh mô tả các chức năng của nó và các hộp văn bản hiển thị tạm thời về các thông tin thêm khi người sử dụng trỏ chuột vào các phần nhất định của hình mô tơ. Trong một cách thức trình bày đa chiều, người sử dụng có cơ hội để trải nghiệm các thông tin từ nhiều góc độ khác nhau, ví dụ một người sử dụng nào đó có thể sẽ chỉ xem phần minh hoạ sống động của một dự án tạo cảnh quan, trong khi người sử dụng khác sẽ chọn đọc đoạn văn bản mô ta. Một trong những cách để khiến cho những văn bản thuần và hình ảnh lôi cuốn người xem là thêm vào các thông tin có yếu tố thời gian chẳng hạn như âm thanh, hoạt hoạ và video. Tuy nhiên, điều quan trọng là ở chỗ các phương tiện thông tin bổ sung không chỉ đơn thuần là lặp lại vai trò của các nội dung và hình ảnh tĩnh. Thực vậy, việc theo dõi một đoạn video chỉ đơn thuần là đọc các đoạn văn trên màn hình là rất nhàm chán. Nhưng nếu cùng với đoạn văn bản đó là phần video hiển thị kèm theo để diễn tả thì nội dung phần văn bản sẽ thú vị hơn rất nhiều. Ngày càng nhiều các tư liệu giáo dục, bao gồm các cuốn sách giáo khoa, và sách bách khoa toàn thư đang được phát triển thành các sản phẩm truyền thông đa phương tiện. Những sản phẩm này có sử dụng âm thanh: hoạt ảnh và đoạn trích video để làm cho phần nội dung sống động hơn. Điều cơ bản là ta phải biết tập trung vào nội dung của chương trình. Đó là cái mà người sử dụng cần. Ví dụ, sức lôi cuốn của một bộ phim hoạt hình chính là có cốt truyện hấp dẫn, cách xây dựng nhân vật tốt. Tương tự, các bộ phim hành động sử dụng công nghệ hoạt ảnh và đồ hoạ máy tính để cải tiến tạo ra các đối tượng hoặc các môi trường trên màn hình chẳng hạn như chuỗi giấc mơ trong phim The Matrix (Ma trận) sẽ kém hấp dẫn nếu cốt truyện tẻ nhạt.
  7. 1.4. Các chuẩn Mutimedia thông dụng Cần phải đặt ra chuẩn cho tất cả mọi cấp đội của hệ đa phương tiện, từ yêu cầu vật lý về mạng cho đến thiết kế giao diện người dùng. Có thể phân loại chuẩn đa phương tiện hiện thời thành chuẩn liên quan đến nội dung của tài liệu (các chuẩn nén dữ liệu), chuẩn kiểm soát cấu trúc. và chuẩn tương tác. 1.4.1. Chuẩn dành cho kiến trúc tài liệu 1.4.1.1. Ngôn ngữ mô tả cấu trúc và nội dung tài liệu Ngôn ngữ mô tả cấu trúc và nội dung tài liệu (Standard Generalised Markup Language - SGML) liên quan tới nội dung tài liệu và cấu trúc hợp lý về các khía cạnh như đầu đề và đoạn văn SGML, căn cứ trên quan điểm về định nghĩa dạng tài liệu (DTD). Những định nghĩa này được sử dụng để quán lý việc tạo ra những tài liệu không chỉ sử dụng giới hạn ở những tài liệu có thể in mà còn có thể được sử dụng cho những tài liệu đa phương tiện trên đĩa Compact. SGML đánh dấu bước chuyển quan trọng trong việc tách thông tin khỏi hình thức trình bày, do đó tạo ra các hình thức trình bày khác nhau của cùng một thông tin. 1.4.1.2. Kiến trúc tài liệu mở (ODA) Bao gồm hình thức trình bày tài liệu và mở rộng phạm vi nội dung. ODA sử dụng phương pháp tương tự SGML nhưng nhấn mạnh đến trao đổi mờ. Được sử dụng để tạo ra các lớp tài liệu có thể truyền tải giữa các hệ thống máy tính khác nhau mà không làm mất thông tin. ISO (tổ chức Chuẩn hoá Quốc Tế) và ITU (Chuẩn Hoá Viễn thông của Liên Đoàn Viễn thông Quốc Tế) đã xuất bản ODA dưới dạng lS8613 và T.410 Series Recommendation. Những chuẩn này xác định 3 loại tài liệu ODA: • Tài liệu cấu trúc hợp lý có thể xử lý được (ví dụ: chương, mục, và đoạn bổ xung), cho phép người nhận có thể sửa đổi nội dung. • Tài liệu đã được định dạng trao đổi cấu trúc trình bày dưới dạng chuỗi trang, với thông tin định vị chẳng hạn khu vực dành cho nội dung ký tự và phông chữ. Không thể sửa đổi được và chỉ in ra được. • Tài liệu có thể xử lý đã được định dạng cho phép trao đổi cả cấu trúc hợp lý và cấu trúc trình bày, làm cho chúng linh động hơn. Người dùng có thể in ảnh và hiệu chỉnh trước. ODA hỗ trợ đánh dấu cả cách trình bày và nội dung, kiến trúc tài liệu được tách rời khỏi cấu trúc nội dung. Bảng dưới đây đề cập đến 3 cấu trúc nội dung ký tự, đồ hoạ hình, ảnh. Nội Chuẩn ISO tương quan Chuẩn ITU tương quan dung Ký tự Bộ ký tự được mã hóa dành cho truyền thông đa Ký tự chúa kiến trúc (T.416) phương tiện thông văn bản (IS6937) Bộ ký tự đồ họa mã hóa 8 bit (IS8859) Đồ họa Siêu tập tin đồ họa máy tính (IS8632) Kiến trúc chúa ảnh hình học
  8. hình (T.418) ảnh Kiến trúc chứa ảnh (T.417) Bộ ký tự được mã hoá dành cho truyền thông đa Ký tự chứa kiến trúc phươnt. tiện thông văn bàn (lS6937) Bộ kế tự đồ (T.416) hoạ mã hoá 8 bit (IS8859) Siêu tập tin đồ hoạ máy tính (IS8632) Kiến trúc chứa ảnh hình học (l.4 1 8) Kiến trúc chứa ảnh ! (l 417) 1.4.1.3. Hytime Ngôn ngữ cấu trúc tài liệu căn cứ vào thời gian / siêu phương tiện ra đời tháng 1l/l992. Dùng đê chuẩn hoá một số thiết bị cần thiết trong các ứng dụng siêu phương tiện. đặc biệt là các ứng dụng lập địa chỉ các khu vực tài liệu siêu phương tiện và các đối tượng thông tin đa phương tiện thành phần, bao gồm cả việc kết nối, chỉnh hàng và đồng bộ hoá. Nó không chuẩn hoá các ký hiệu nội dung dữ liệu, mã hoá đối tượng thông tin hay xử lý ứng dụng. Hytime cho phép mã hoá theo dòng tuyến tính một ứng dụng đa phương tiện hoàn hảo bao gồm cấu trúc, liên kết siêu phương tiện, đồng bộ hoá và định giờ. Hytime căn cứ trên ngôn ngữ Standard Getlcrralized Markup (SGML) và sử dụng Abstract Syntax Notation 1 (ASN.l), cho phép biểu diễn các chuỗi bit để trao đổi. Nó bổ sung chuẩn cho các đối tượng đa phương tiện đơn lẻ, chẳng hạn JPG cho ảnh tĩnh, MPEG cho tư liệu audiovisual. 1.4.2. Chuẩn dành cho tương tác • MHIEG: đề cập đến các chủ đề như đồng bộ hoá, bộ nhớ đệm, đối tượng nhập nó được thiết kế nhằm đáp ứng yêu cầu của ứng dụng đa phương tiện chạy trên các trạm từ nhiều hãng khác nhau và trao đổi thông tin theo thời gian thực. Những ứng dụng như thế bao gồm nghiên cứu, hợp tác do máy tính hỗ trợ, hệ xuất bản điện tử và các ứng dụng dùng trong giáo dục đào tạo. Chuẩn MHEG được phát triển thành 2 phần: √ Phần 1 đề cập đến ghi chú ASN. 1 √ Phần 2 liên quan tới ghi chú trên căn cứ trên SGML • SMSL: Ngôn ngữ chuẩn biên soạn siêu phương tiện/đa phương tiện (SMSL) được kết hợp từ ISO và ITU, liên quan đến nhóm nghiên cứu SGML và MHEG, ngôn ngữ này phát triển script điều khiển tương tác người dùng với tài liệu siêu phương tiện và đa phương tiện. SMSL được dùng để tạo tính tương thích và tính cử động giữa các hệ của script đa phương tiện.
  9. 1.4.3. Framework và mô hình tham chiếu Như đã biết, đa phương tiện tác động đến nhiều lĩnh vực phát triển ứng dụng khác nhau. Không tồn tại mô hình tham chiếu đơn nào để kết hợp những mảnh này lại với nhau và xác định cách thức chúng giao tiếp nhau. OII đã khởi xướng nghiên cứu trong lĩnh vực này và đưa ra 3 mô hình tham chiếu hiện có: ODP (Xử lý phân tán mở), mô hình tham chiếu Berkom, Framework và mô hình siêu phương tiện/đa phương tiện (MHEG) • Xử lý phân tán mở (ODP): ODP là hoạt động kết hợp ISO và ITU có mục tiêu là thúc đẩy các thành phần hệ phân tán hợp tác với nhau trong môi trường đồng nhất. Các chế độ và chuẩn ứng dụng đã được nâng cấp cần phải tương thích với ứng dụng là phương tiện phân tán. • Mô hình tham chiếu Berkom: Hệ thống truyền thông đa phương tiện thông tin Berkom là dịch vụ cải tiến cho mạng cáp quang. Mô hình này đóng vai trò là nền tảng cho giao diện lập trình ứng dụng. Nó thích hợp cho các ứng dụng đa phương tiện mà có thể di chuyển giữa các hệ khác nhau và cũng hỗ trợ tích hợp các phương tiện khác nhau. Mô hình tham chiếu bao gồm 3 hệ chính: √ Hệ hoạt động cung cấp giao diện mạng cho hệ thống trực tiếp đa phương tiện. √ Hệ truyền thông đa phương tiện thông cung cấp giao diện lưu thông cho dịch vụ từ xa đa phương tiện. √ Hệ ứng dụng chung cung cấp các ứng dụng khác nhau với giao diện trên dịch vụ từ xa đa phương tiện chung. • Framework và mô hình siêu phương tiện/đa phương tiện (MHMF): MHMF kết hợp từ JTC 1 và SC 18, làm nền tảng cho việc chuẩn hoá đa phương tiện hiện tại và tương lai. Và hiện vẫn đang được tiếp tục phát triển.
  10. CHƯƠNG II ỨNG DỤNG CỦA ĐA PHƯƠNG TIỆN TRONG ĐỜI SỐNG Mặc dù các công nghệ truyền thông đa phương tiện trên PC mới chỉ xuất hiện trong một thời gian tương đối ngắn nhưng chúng ta đã xây dựng được rất nhiều ứng dụng khác nhau: Trong gia đình, trường học, tại nơi làm việc và những nơi khác, các chương trình truyền thông đa phương tiện đều là phần tích hợp trong cách thức mà chúng ta dạy và học, cách chúng ta giao tiếp quản lý do ảnh nghiệp và giải trí. Trong chương này chúng ta sẽ tìm hiểu một vài lĩnh vực ứng dụng của công nghệ truyền thông đa phương tiện. 2.1. Truyền thông đa phương tiện trong đào tạo và giáo dục. 2.1.1. giới thiệu chung Trong các trường học ngày nay, các máy tính truyền thông đa phương tiện thông đa phương tiện là một phần không thể thiếu của nhiều lớp học và đưa việc học lên một mức độ tương tác mới. Một hoạt động cải cách chủ yếu trong giáo dục sẽ khuyến khích được cách học tích cực và công tác. Máy tính và truyền thông đa phương tiện sẽ giúp các sinh viên và giảng viên chuyển đổi sang mô hình học tập mới này. Trong lớp học, các phần trình bày trực quan kết hợp giữa hoạt ảnh, video và âm thanh sẽ thúc đẩy các sinh viên trở thành người tham gia tích cực trong quá trình học. Các chương trình truyền thông đa phương tiện tương tác đưa các khái niệm vào cuộc sống và giúp sinh viên tích hợp phần tư duy cốt lõi và các kỹ năng giải quyết vấn đề. Bộ bách khoa toàn thư trên CD-ROM là một ví dụ rõ ràng của một ứng dụng truyền thông đa phương tiện tương tác trong ngành giáo dục. Nếu sinh viên phải viết một báo cáo về một vùng nào đó ở Ai Cập thì họ có thể đọc về lịch sử, địa lý và với một cú nhấp chuột họ có thể thấy các đoạn trích video về sự bận rộn, hối hả trong một thành phố và nghe các đoạn trích của các ngôn ngữ Ai Cập hai bản nhạc địa phương (hình 2.1, 2.2). Kết quả là thông tin đã đi vào cuộc sống và sinh viên thậm chí có thể có các công cụ phần mềm đề cho ra các bản báo cáo của họ trong dạng thức của một bản trình chiếu truyền thông đa phương tiện.
  11. Hình 1.1: Minh hoạ một bài học về Ai Cập Thậm chí trẻ em cũng có thể vừa học vừa vui chơi và chính các sản phẩm truyền thông đa phương tiện trên CD hay trên Internet là những sản phẩm hàng đầu của loại hoạt động này. Bằng cách sử dụng các nhân vật hoạt hình để dẫn đường. Các trò chơi truyền thông đa phương tiện chăng hạn như Reader Rabbit. MathBlaster, Jumstart và các chương trình khác có thể giúp học sinh nhỏ làm chủ được các kỹ năng cơ bản trong môi trường tương tác thú vị có cung cấp các phản hồi cá nhân. Mạng Internet cũng cung cấp một số các công cụ học tập hữu ích ngoài lớp học. hàng trăm Website hướng về việc học tập cho phép trẻ em tham gia vào các dự án tương tác. câu đố và trò chơi.
  12. • Website www.MaMaMedia.com cho phép trẻ con tạo ra các câu chuyện và câu đố tham gia vào các hoạt động giải quyết vấn đề và chia sẻ các sáng tác của chúng với nhau. • Một số website cung cấp cơ chế học từ xa (distance learning) như: www.thitruong.com.vn Những site này cho phép học viên tham gia vào các lớp, tương tác với người giảng viên, gửi bài tập, dự án, và hoàn tất các kỳ thi trực tuyến. • Các bộ bách khoa toàn thư trực tuyến: www.enearta.com www.britannica.com www.eneyberpedia.com www.funkandwagnalls.com www.eneyelopedia.com • Các từ điển trực tuyến: www.m-v.com www.onelook.com www.eup.cam.ac.uk/elt/dietionary/ www.notam.uio.no/~hcholm/altlang/ • Các từ điển đồng nghĩa trực tuyến: www.thesaurus.com www.wordsmyth.net www.links.es.emu.edu/lexfn • Công cụ tim kiếm cụm từ: www.shu.ac.uk/webadmin/phrases/go.html • Từ điển các từ viết tắt trong tiếng ảnh: • Một số site cho phép học trên web như: www.vovisoft.com www.quantrimang.com www.aspvn.net www.manguon.com 2.1.2. Phát triển E-learning trong đào tạo từ xa Khoảng 2 năm trở lại đây thuật ngữ E-learning bắt dầu được biết đến tại Việt Nam, nhiều hãng, công ty và các trường đại học bắt đầu giới thiệu các sản phẩm E-learning. Điển hình như Cisco với chương trình CCNA/CCNP/CCIE, Intel với mô hình E-learning giới thiệu tại Việt Nam vào tháng 7/2003 và sẽ có khả năng trở thành đối tác chính của Bộ giáo dục - đào tạo trong việc phát triển E-learning trong thời gian tới, công ty điện toán và truyền số liệu (VDC) kết hợp với Netlearner (Singapo) với dịch vụ đào tạo từ xa bán E-learning khai trương đầu năm 2003, công ty VASC với trang Web: truongthi.com. công ty Hà Thành với trang Web: khoabang.com, FPT với cổng đào tạo trực tuyến Vậy E-learning là gì?, Hệ thống E-
  13. learning bao gồm những thành phần gì?; Việc phát triển E-learning trong diều kiện cụ thể của Học viện và các trung tâm tâm đào tạo như thế nào?. 2.1.2.1. Tông quát về E-learing a. Giới thiệu chung Nhiều nhà chuyên môn cho rằng E-learning - phương pháp giáo dục đào tạo mới được đánh giá là cuộc cách mạng trong giáo dục thế kỷ 21. Theo ông Keith Holtham, Giám đốc phụ trách các giải pháp cho do ảnh nghiệp khu vực châu Á - Thái Bình Dương (Intel). E-Learning căn bản dựa trên công nghệ mạng ngang hàng (P2P). Đây là giải pháp sử dụng công nghệ cao để hỗ trợ quá trình học tập cung cấp các dịch vụ đào tạo, khóa học qua mạng Internet hoặc Intranet cho người dùng máy tính. Ưu điểm nổi trội của E-Learning so với các phương pháp giáo dục truyền thống là việc tạo ra một môi trường học tập mở và tính chất tái sử dụng các đơn vị tri thức (learning object). Với công nghệ này. Quá trình dạy và học sẽ hiệu quả và nh ảnh chóng hơn, giúp giảm khoảng 60% chi phí, đông thời giảm thời gian đào tạo 20-40% so với phương pháp giảng dạy truyền thống. E-learning chuyên tái nội dung phong phú, ấn tượng và dễ hiểu thông qua trang web, bảo đảm chất lượng đào tạo qua những phần mềm quản lý. Mô hình này cho phép học viên cũng như nhân viên tại các công ty chọn học những thứ cần thiết chứ không bó buộc như trước. Bên cạnh đó, học viên có thể học bất cứ lúc nào bằng cách nối mạng mà không cần phải đến trường. Trên phạm vi toàn cầu hiện nay có nhiều công ty lớn đầu tư vào E-Learning. Năm 2000, thị trường này đã đạt do ảnh số 2.2 tỷ USD. Người ta dự tính, đến năm 2005. E-Learning trên toàn cầu sẽ đạt tới 18.5 tỷ USD, ở các nước công nghiệp phát triển, điển hình là Mỹ, lĩnh vực này đang phát triển rất nh ảnh. Thị trường L-Learning ở Mỹ sẽ đạt 11.4 tỷ USD vào năm 2004. Tại châu á, thị trường này tăng trưởng 25% mỗi năm (đạt 6,2 tỷ USD). Theo số liệu của tập đoàn dữ liệu quốc tế IDC, năm 2003, thế giới sẽ thiêu khoảng 1.45 triệu chuyên ra mạng do đó nhu cầu về nguồn nhân lực này ngày càng lớn cùng với mức độ phức tạp xung qu ảnh việc thiết kế triển khai và bảo trì hệ thống mạng máy tính trong nền kinh tế Internet. Chính vì vậy E-Learning đang được rất nhiều người học quan tâm và theo học. b. Vậy hiểu một cách chung nhất thì E-learning là gì? E- learning (electronic learning: Học điện tử): Thuật ngữ bao hàm một tập hợp các ứng dụng và quá trình, như học qua Web, học qua máy tính, lớp học ảo và sự liên kết số. Trong đó bao gồm việc phân phối nội dung các khoá học tới học viên qua lnternet, mạng intranet/extranet (LAN/WAN), băng audio và video vệ tinh quảng bá. truyền hình tương tác. CD-ROM, và các loại học liệu điện tử khác. Hình 2.3 mô tả một cách tổng quát khái niệm E-learning. Trong mô hình này, hệ thống đào tạo bao gồm 4 thành phần, toàn bộ hoặc một phần của những thành phần nào được chuyền tải tới người học thông qua các phương tiện truyền thông điện tử.
  14. • Nội dung: Các nội dung đào tạo, bài giảng được thể hiện dưới dạng các phương tiện truyền thông điện tử, đa phương tiện. Ví dụ các bài giảng CBT viết bằng toolbookII, . • Phân phối: Việc phân phối các nội dung đào tạo được thực hiện thông qua các phương tiện điện tử. Ví dụ tài liệu được gửi cho học viên bằng e-mail, học viên học trên website, học qua đĩa CD-Rom multimedia,. . . • Quản lý: Quá trình quản lý đào tạo được thực hiện hoàn toàn nhờ phương tiện truyền thông điện tử. Ví dụ như việc đăng ký học qua mạng, bằng bản tin nhắn SMS, việc theo dõi tiến độ học tập (điểm d ảnh) được thực hiện qua mạng Internet • Hợp tác: Sự hợp tác, trao đổi của người học trong quá trình học tập cũng được thông qua phương tiện truyền thông điện tử. Ví dụ như việc trao đổi thảo luận thông qua chat, Form trên mạng,. . . Tóm lại E-learning được hiểu một cách chung nhất là quá trình học thông qua các phương trên điện tử. Ngày nay với sự hội tụ của máy tính và truyền thông E- learning được hiểu một cách trực tiếp hơn là quá trình học thông qua mạng lntemet và công nghệ Web. c. Vài nét về lịch sử E-learning Trước năm l983: Kỷ nguyên giảng viên làm trung tâm. Trước khi máy tính được sử dụng rộng rãi. Phương pháp giáo dụng “lấy giảng viên làm trung tâm" là phương pháp phổ biến nhất trong các trường học. Học viên chỉ có thể trao đổi tập trung qu ảnh giảng viên và các bạn học. Đặc điểm của loại hình nào là giá thành đào tạo rẻ. Giai đoạn 1984-1993 : Kỷ nguyên đa phương tiện. Hệ diều hành Windows 3.1, Máy tính Macintosh, phần mềm trình diễn powerpoint đây là các công nghệ cơ bản trong kỷ nguyên đa phương tiện. Nó cho phép tạo ra các bài giảng tích hợp hình ảnh và âm thanh học trên máy tính sử dụng công nghệ CBT phân phối qua đĩa CD- ROM hoặc đĩa mềm, vào bất kỳ thời gian nào. Ở đây, người học cũng có thể mua và học. Tuy nhiên sự hướng dẫn của giảng viên là rất hạn chế. • Giai đoạn : 1994-1999 Làn sóng E-learning thứ nhất
  15. Khi công nghệ Web được phát minh ra, các nhà cung cấp dịch vụ đào tạo bắt đầu nghiên cứu cách thức cải tiếp phương pháp giáo dục bằng công nghệ này. Người thầy thông thái đã dần lộ rõ thông qua các phương tiện: E-mail, CBT qua lntranet với text và hình ảnh đơn giản: đào tạo bằng công nghệ WEB với hình ảnh chuyển động tốc độ thấp đã được triển khai trên diện rộng. • Giai đoạn: 2000-2005 Làn sóng E-learning thứ hai. Các công nghệ tiên tiến bao gồm JAVA và các ứng dụng mạng IP, công nghệ truy nhập mạng và băng thông Internet được nâng cao, các công nghệ thiết kế Web tiên tiến đã trở thành một cuộc cách mạng trong giáo dục đào tạo. Ngày nay thông qua Web giáo viên có thể kết hợp hướng dẫn trực tuyến (hình ảnh, âm thanh, các công cụ trình diễn) tới mọi người học, nâng cao hơn chất lượng dịch vụ đào tạo. Ngày qua ngày công nghệ Web đã chứng tỏ có khả năng mang lại hiệu qủa cao trong giáo dục đào tạo, cho phép đa dạng hoá các môi trường học tập. Tất cả những điều đó tạo ra một cuộc cách mạng trong đào tạo với giá thành rẻ, chất lượng và hiệu qua. Đó chính là làn sóng thứ 2 của E- learning. d. E-learning có những khác biệt gì so với đào tạo truyền thống? E-1earning khác với đào tạo truyền thống ở ba điểm sau: • Không bị giới hạn bởi không gian và thời gian: một khoá học E- learning được chuyển tải qua một máy tính tới cho người học, điều này cho phép các học viên có thể linh hoạt lựa chọn khoá học từ một máy tính dễ bàn hoặc từ một máy tính xách tay với một modem di động chạy phí trên một bãi biển. • Tính linh hoạt : Một khoá học E-learning được phục vụ theo nhu cầu người học, chứ không nhất thiết phải bám theo một thời gian biểu cố định. Vì thế người học có thể lựa chọn, tham gia khoá học tuỳ theo hoàn cảnh của mình. • Truy nhập ngẫu nhiên: Bảng danh mục bài giảng sẽ cho phép học viên lựa chọn phần bài giảng, tài liệu một cách tuỳ ý theo trình độ kiến thức và điều kiện truy nhập mạng của mình. Học viên tự tìm ra các kĩ năng học cho riêng mình với sự giúp đỡ của những tài liệu trực tuyến. Tất nhiên cũng có một số cách học khác. Ví dụ như, các lớp học thông qua trang Web dùng phần mềm hội thảo video trên mạng và các phần mềm khác cho phép các học viên từ xa tham gia một khoá học trên lớp học truyền thống. Một số khoá học trên trang Web theo yêu cầu có giảng viên (hoặc người hướng dẫn) tương tác thường xuyên với từng học viên hoặc với các nhóm học viên. e. Có nên chuyển đổi sang E-learning hay không? Trước khi lưu giữ các slide cua giảng viên dưới dạng HTML và số hoá lời giảng, chúng ta nên cân nhắc chi phí và lợi ích của việc chuyển đổi này. Để làm điều đó, cần phải xem xét quan điểm của cả hai phía: phía cơ sở đào tạo (hoặc nhà cung cấp dịch vụ đào tạo) và phía người học. Nếu đối với cả phía cơ sở đào tạo và người học, học bằng E-learning có nhiều lợi ích hơn so với bất lợi thì việc chuyển đổi sang học bằng E-learning có thì là một phương pháp hữu hiệu. Quan điểm của Cơ sở đào tạo Cơ sở đào tạo là một tổ chức thiết kế và cung cấp các khóa học trực tuyến E-learning,
  16. nó có thể chỉ là một phòng ban trong công ty khi muốn đào tạo nội bộ, hoặc là toàn bộ Trường/Viện/Công ty nếu cơ sở đó bán chương trình đào tạo cho các người học độc lập hoặc cơ sở khác. Hãy thử so sánh ưu và nhược điểm đối với cơ sở đào tạo khi chuyển đổi các khoá học truyền thống sang khoá học E-learning. Bảng 2.1. Ưu điểm và nhược điểm của E-learning Ưu điểm Nhược điểm Giảm chi phí đào tạo. Sau khi đã phát Chi phí phát triển một khoá học lớn. Việc học qua triển xong, một khoá học E-learning mạng còn mới mẻ và cần có các chuyên viên kỹ có thể dạy 1000 học viên với chi phí thuật để thiết kế khoá học. Triển khai một lớp học chỉ cao hơn một chút so với tổ chức E- learning có thể tốn gấp 4 - 10 lần so với một khoá đào tạo cho 20 hoc viên. học thông thường với nội dung tương đương. Rút ngắn thời gian đào tạo. Việc học Yêu cầu kỹ năng mới. Những người có khả năng trên mạng có thể đào tạo cấp tốc cho giảng dạy tốt trên lớp chưa chắc đã có trình độ thiết một lượng lớn học viên mà không bị kế khóa học trên mạng. Phía cơ sở đào tạo có thể giới hạn bội số lượng giảng viên phải đào tạo lại một số giảng viên và tìm việc mới hướng dẫn hoặc lớp học. cho số còn lại. Cần ít phương tiện hơn. Các máy chủ Lợi ích của việc học trên mạng vẫn chưa được và phần mềm cần thiết cho việc học khảng định. Các học viên dã hiểu được giá trị của trên mạng có chi phí rẻ hơn rất nhiều viêck học 3 ngày trên lớp có thể vẫn ngần ngại khi so với phòng học, bảng, bàn ghế, và bỏ ra một chi phí tương đương cho một khoá học các cơ sở vật chất khác. trên mạng thậm chí còn hiệu quả hơn. Giảng viên và học viên không phải đi Đòi hỏi phải thiết kế lại chương trình đào tạo. Việc lại nhiều. các học viên không có các kết nối tốc độ cao đòi hỏi phía đào tạo phải luôn xây dựng lại các khoá học để khắc phục những hạn chế đó. Tổng hợp được kiến thức. Việc học trên mạng có thể giúp học viên nắm bắt được kiến thức của giảng viên, dễ dàng sàng lọc, và tái sử dụng chúng. Quan điểm của người học Cá nhân hoặc tổ chức tham gia các khoá học E-learning trên mạng chắc chắn sẽ thấy việc đào tạo này xứng đáng với thời gian và số tiền họ bỏ ra. Bảng dưới đây sẽ so sánh thuận lợi và khó khăn đối với học viên khi họ chuyển đổi việc học tập theo phương pháp truyền
  17. thống sang học tập bằng E-learning. Bảng 2.2: Ưu điểm và nhược điểm của E- learning theo quan điểm của người học Ưu điểm Nhược điểm Có thể học bất cứ lúc nào, tại bất kỳ nơi đâu. Kỹ thuật phức tạp. Trước khi có thể bắt đầu khoá học, họ phải thông thạo các kỹ năng mới. Không phải đi lại nhiều và không phải nghĩ việc Chi phí kỹ thuật cao: Để tham gia học Học viên có thể tiết kiệm chi phí đi lại tới nơi trên mạng, học viên phải cài đặt Turbo học. Đồng thời, họ có thể dễ đàng điều chỉnh thời trên máy tính của mình, tải và cài đặt các gian học phù hợp với thời gian làm việc của mình. chức năng Plug-ins, và kết nối vào mạng. Có thể tự quyết định việc học của mình. học viên Việc học có thể buồn tẻ. Một số học viên chỉ học những gì mà họ cần. sẽ cảm thấy thiếu quan hệ bạn bè và sự tiếp xúc trên lớp. Khả năng truy cập được nâng cao. Việc tiếp cận Yêu cầu ý thức cá nhân cao hơn: Việc những khoá học trên mạng được thiết kế hợp lý sẽ học qua mạng yêu cầu bản thân học viên dễ dàng hơn đối với những người không có khả phải có trách nhiệm hơn đối với việc học năng nghe, nhìn; những người học ngoại ngữ hai; của chính họ. Một số người sẽ cảm thấy và những người không có, khả năng học như khó khăn trong việc tạo ra cho mình một người bị mắc chứng khó đọc. lịch học cố định. Những thuận lợi và khó khăn trên là không tránh khỏi. Với việc chuẩn bị tốt, học viên có thể khắc phục được hầu hết các khó khăn. Nêu chuẩn bị không tốt và việc tổ chức đào tạo bằng E-learning của cơ sở đào tạo chưa được kỹ càng thì học viên sẽ không thấy được những thuận lợi của những khoá học trên mạng. Ví dụ: nếu những bài học không được bố cục rõ ràng và định hướng cụ thể thì việc tự học sẽ không hứa hẹn điều gì cả. Ngược lại, học viên có thể khắc phục được sự buồn tẻ của việc học trực tuyến bằng cách thảo luận hoặc chat với giảng viên và bạn học qua mạng. 2.1.2.2. E-learning và các phương thức đào tạo khác Nhìn chung các nhà chuyên môn đều cho rằng, trong thế kỷ 21 mô hình đào tạo sẽ bao gồm 3 phương thức: Đào tạo truyền thống. đào tạo tương tác (Vệ tinh/ISDN/IP). Và Đào tạo không tương tác bằng E-learning. Tuỳ theo từng nội dung đào tạo và khả năng tài chính mà các cơ sở đào tạo sẽ sử dụng kết hợp các phương thức đào tạo trong mô hình này ở một mức độ phù hợp. Bảng2.3: Các phương thức đào tạo
  18. Phương thức Nội dung đào tạo (Mức độ chuyên môn) Số lượng người học Đào tạo truyền thống Cao, phức tạp. Các nội dung đào tạo có tính Ít phải tập trung về hàn lâm (dài hạn), chuyên môn cao, đòi hỏi cơ sở đào tạo để thực tế: thực hành-thực tập, trao đổi thông tin học tập trực tiếp, Đào tạo từ xa tương Trung bình. Các nội dung, chủ đề mang tính Nhiều (tới vài trăm tác có giảng viên thông phổ cập, giới thiệu, không đòi hỏi trình độ học viên/khóa qua truyền hình hội chuyên môn cao ít thực hành thực tập như ở học), học tập trung nghị Vệ tinh/ISDN/IP đào tạo không tương tác nhưng đòi hỏi tính tại điểm xa cơ sở chuyên môn cao hơn, cần có sự trao đổi, giải đào tạo đáp hướng dẫn của đội ngũ giảng viên và các nhà quản lý. Đào tạo từ xa không Trung bình và thấp. Các nội dung, chủ đề Nhiều (tới hàng tương tác bằng E- mang tính phổ cập, giới thiệu, không đòi hỏi ngàn học viên). học learning. trình độ chuyên môn cao, ít thực hành thực ở mọi lúc. mọi nơi. tập, Các nội dung đào tạo phù hợp tốt với khả năng, tự học- tự nghiên cứu thông qua các phương tiện điện tử. 2.1.3. Cấu trúc của một hệ thống E- learning điển hình 2.1.3.1. Mô hình chức năng Mô hình chức năng có thể cung cấp một cái nhìn trực quan về các thành phần tạo nên nôi trường E-learnin và những đối tượng thông tin giữa chúng. ADL (Advanccd Distributed Learning) - một tổ chức chuyên nghiên cứu và khuyến khích việc phát triển và phân phối học viên sử dụng các công nghệ mới, đã công bố các tiêu chuẩn cho SCORM (Mô hình chuẩn đơn vị nội dung chia sẻ) mô tả tổng quát chức năng của một hệ thống E-learning bao gồm (hình 2.4). • Hệ thống quản lý học tập (LMS) như là một hệ thống dịch vụ quản lý việc phân phối và tìm kiếm nội dung học tập cho người học, tức là LMS quản lý các quá trình học tập. • Hệ thống quản lý nội dung học tập (LCMS): Một LCMS là một môi trường đa người dùng. Ở đó các cơ sở đào tạo có thể tạo ra, lưu trữ, sử dụng lại, quản lý và phân phối nội dung học tập trong môi trường số từ một kho dữ liệu trung tâm. LCMS quản lý các quá trình tạo ra và phân phối nội dung học tập. LMS cần trao đổi thông tin về hồ sơ người sử dụng và thông tin đăng nhập của người sử dụng với các hệ thống khác, vị trí của khoá học từ LCMS và lấy thông tin về các hoạt động của học viên từ LCMS.
  19. Chìa khoá cho sự kết hợp thành công giữa LMS và LCMS là tính mở, sự tương tác. Hình 2.5 mô tả một mô hình kiến trúc của hệ thống E-learning sử dụng công nghệ Web để thực hiện tính năng tương tác giữa LMS và LCMS cũng như với các hệ thống khác. Trên cơ sở các đặc tính của dịch vụ Web, người ta thấy rằng các dịch vụ Web có khả năng tối để thực hiện tính năng liên kết của các hệ thống E- learning bởi các lý do sau: • Thông tin trao đổi giữa các hệ thống E-learning như LOM, gói tin IMS đều tuân thủ tiêu chuẩn XML. • Mô hình kiến trúc Web là nền tảng và độc lập về ngôn ngữ với E-learning thông tin trao đổi giữa các hệ thống E-learning như LOM, gói tin IMS đều tuân thủ tiêu chuẩn XML. 2.1.3.2. Mô hình hệ thống Một cách tổng thể một hệ thống E-learning bao gồm 3 phần chính (hình 2.6): • Hạ tầng truyền thông và mạng: Bao gồm các thiết bị đầu cuối người dùng (học viên), thiết bị tại các cơ sở cung cấp dịch vụ, mạng truyền thông,
  20. • Hạ tầng phần mềm: Các phần mềm LMS. LCMS (MarcoMedia. Autrthorware, loolbook ) • Nội dung đào tạo (hạ tầng thông tin): Phần quan trọng của E- learning là nội dung các khoá học. các chương trình đào tạo), các coursewaer. 2.1.3.3. phát triển nội dung khoá học trong E- learning Để phát triển E-learning, cần phải song song giải quyết nhiều vấn đề như hạ tầng phần cứng, nhân lực, giảng viên, các phần mềm quản lý học tập (LMS), và điều quan trọng là phải có được nội dung các khoá học E-learning, một thứ "hàng hoá" trong môi trường đào tạo của nền kinh tế Internet. Phần dưới đây mô tả các phương thức để phát triển nội dung khoá học trong là E-learning. Các cơ sở đào lạo E-learning có thể sử dụng một trong 3 cách dưới đây để phát triển nội dung các khoá học E-learning cho mình. a. Xây dựng mới toàn bộ Có thể bao gồm cả việc xây dựng từ đâu các bài giảng truyền thống (bài giảng. giáo trình, sách giáo khoa sau đó bắt đầu chuyển sang giai đoạn chuyển đổi học liệu. Các công việc này có thể bao gồm • Thiết kế kịch bản (giáo án, đề cương) • Xây dựng các trang hình (hình ảnh tĩnh/động + trang text)
  21. • Xây dựng các đoạn phim ( video clip) • Xây dựng các đoạn âm thanh (audio clip) • Tích hợp các trang màn hình (tích hợp các loại học liệu thành các đoạn bài giảng hoàn chỉnh) • Phát triển multimedia (Kết hợp truyền thông đa phương tiện) Mỗi một quá trình đều cần phải có đội ngũ nhân lực có tính chuyên nghiệp cao và những công cụ phù hợp. Do đó chi phí xây dựng ban đầu là rất lớn cho một chương trình đào tạo có tính hấp dẫn. b. Mua sản phẩm đã thương mại hoá hoặc đặt hàng Hiện nay việc mua một sản phẩm đào tạo E- learning bao gồm: • Mua một khoá học hoặc một chương trình đào tạo với những số lượng User xác định, sau đó sản phẩm đó sẽ được cài đặt tại máy chủ của đơn vị đặt mua. • Đặt hàng một hãng đã có sản phẩm thương mại hoặc thuê khoán một đơn vị sản xuất một chương trình đào tạo theo đơn đặt hàng. Để có thể đặt hàng được, hai bên phải tuân theo một tiêu chuẩn nào đó hoặc bên đặt hàng phải đề ra các tiêu chuẩn cho bài giảng E-learning. Mức độ sinh động của bài giảng sẽ quá ất định tới giá thành xây dựng bài giảng. c. Mua lại ý tưởng và chuyển đổi nội dung khoá học cho phù hợp với yêu cầu đào tạo Đối với một khoá học E- learning, việc thiết kế kịch bản (script) là công việc tương đối khó khăn. Nó vừa đòi hỏi tính chuyên môn cao về mặt nội dung (vai trò của giảng viên), vừa đòi hỏi tính kỹ thuật trình bày (vai trò của các chuyên gia máy tính, điều đó trong thực tế chúng ta lại khó có được trong thực tế, để đơn giản quá trình này, chúng ta có thể mua chương trình E-learning theo chủ đề đã sẵn có là học làm theo ý tưởng đã có băng cách : • Đăng ký theo học trên mạng (học trực tuyến) • Đăng ký mua sản phẩm đào tạo cho 1 User (dạng CBT) Trên cơ sở nội dung các khoá học đã được biết, chúng ta có thể học cách làm và làm lại bằng cách tạo mới hoặc chuyển đổi cho phù hợp với yêu cầu của chúng ta (ví dụ như biên tập lại hình ảnh, dịch phần text và audio, ). Cách làm này có thể giảm được thời gian và chi phí so với việc xây dựng mới toàn bộ. Với cách làm này, sau từ 1-2 năm có thể phát triển được 20-30 khoá học E-learning. Xem xét trong điều kiện hiện tại của Học viên và các trường đại học, việc sử dụng linh hoạt 3 phương thức trên là tối ưu hơn cả. Ví dụ với các khoá học về công nghệ đã được chuẩn hoá chúng ta sẽ mua mới để sử dụng hoặc biên tập lại, các khoá học về khoa học cơ bản có thể đặt hàng các công ty phần mềm trong nước (như CDIT, VASC, VDC), các khoá học bồi dưỡng nghiệp vụ sẽ xây dựng mới. 2.1.4. Kết luận Đào tạo từ xa được xem là một mô hình giáo dục trong kỷ nguyên thông tin. trong đó E-
  22. learning dang được đánh giá là có nhiều ưu thế nhất trong những giải pháp triển khai đào tạo từ xa. Chính vì vậy việc tiếp tục nghiên cứu, tìm hiểu, trao đổi thông tin và thống nhất nhận thức về E-learning để góp phần thúc dẩy sự phát triển E-learning là một việc làm cần thiết và cấp bách. Một số nhà cung cấp giải pháp E-learing Sản phẩm hoặc dịch vụ Nhà cung cấp Nhận xét Các khoá học (nội dung): sản phẩm www.SkillSoft.com Cung cấp nhiều chủ đề có sẵn, không theo yêu cầu của www.Netg.com khách hàng của nhà cung cấp duy www.Smarfoce.com nhất. Các khóa học: sản phẩm có sẵn, www.Elementk.com không theo yêu cầu của khách hàng www.KnowledgePlanet.com của nhiều nhà cung cấp. www.Click2learn.com www.Digitallink.com Các khoá học hỗn hợp www.Elementk.com www.Mentergy.com www.Knowledgenet.com Khoá học theo nhu cầu khách hàng www.KnowledgePlanet.com Rất đắt Tái sử dụng các nội dung, kiến thức www.Knowledgemechanies.com đã có www.Learframe.com Các công cụ soạn bài giảng: Web site www.Microsoft.com Tạo và quản 1ý www.Macromedia.com Website có hỗ trợ đa phương tiện: Pontpage. Các công cụ soạn bài giảng: Đồ hoạ www.Macromedia.com Firework www.Adobe.com Photoshop Các công cụ soạn bài giảng: www.Macromedia.com Authorware Multimedia www.Click2learn.com Directorrlash Toolbook www.Apple.com Quicktime LMS www.ThinkQ.com www.Docent.com www.Saba.com www.Learnframe.com www.Geolearning.com www.Digitalthink.com
  23. Web hosting www.Smartforee.com www.Geolearning.com www.Digitalthink.com www.Metergy.com Đánh giá, giám sát, kiểm tra www.QuestionMark.com Đáp ứng nhu cầu www.Zoomerang.com khách hàng Đánh giá (chỉ đánh giá kỹ năng, www.DDIworld.com không có kiểm tra cuối khoá và khảo www.Digitalthink.com sát) Hội nghị (computer conference) www.Centra.com Hội nghị tương tác, www.Mentergy.com thời gian thực www.Interwise.com www.Presenter.com Sự cộng tác (collaboration) www.Placeware.com Trao đổi tương tác, www.Ichat.com thời gian thực www.Metorware.com Dịch vụ tư vấn E-learning www.Arthurandersen.com Lưu ý có một số công www.Accenture.com ty có liên kết với nhà cung cấp www.Kpmg.com www.Arthurdlittle.com 2.2. Truyền thông đa phương tiện trong thông tin và bán hàng Việc các phương tiện như hoạt ảnh, âm thanh và video được đưa vào lĩnh vực thương mại có vẻ như là kỳ cục nhưng xu hướng sử dụng các phương tiện này trong nhiều hoạt động kinh do ảnh là tất yếu. Các công ty sử dụng các công nghệ phương tiện mới theo nhiều cách để thực hiện các công việc nội bộ cũng như làm việc với khách hàng hiệu quả hơn. Ví dụ, đào tạo là việc thông bao giờ dừng trong các tập đoàn lớn. nhất là khi các công ty mong muốn các nhân viên của mình làm chủ được các công nghệ máy tính mới nhất. Như một sự thay thế hoặc bổ sung cho đào tạo trong các phòng học nhiều công ty đã triển khai các tư liệu đào tạo tương tác đặc thù. Những tư liệu này rơi vào loại sản phẩm được gọi là sản phẩm đào tạo trên máy tính (Computer Based Training – CBT). Các tập đoàn, công ty đã đầu tư hàng triệu đô la để phát triển các khoá học CBT đặc thù liên quan đến nhiều vấn đề khác nhau chẳng hạn như chính sách cua công ty, các hệ thống máy tính tuỳ biến và các quan hệ khách hàng. Nhiều công ty đã sử dụng sản phẩm CBT đặc thù để cho các nhân viên đại diện bán hàng luôn được cập nhật về sự thay đổi liên tục của sản phẩm, dịch vụ và cấu trúc giá - thông tin mang yếu tố quyết định đối với sự thành công của việc bán hàng và quá trình quản lý khách hàng. Phần mềm dạy học CBT đầu tiên được thiết kế trong đĩa compact vốn rất tiện lợi cho những người làm việc tại công trường và các văn phòng ở xa. Những sản phẩm này có thể gồm các thông tin âm thanh và video cũng như thông tin dạng chữ, thậm chí có thể gồm các
  24. cơ chế kiểm tra và đánh giá thời gian thực để đảm bảo rằng người học đã nắm vững các khái niệm hay để đảm bảo rằng các kĩ năng đã được truyền dạt. Bán hàng và tiếp thị sẽ mang một ý nghĩa mới trong thời đại của công nghệ và truyền thông đa phương tiện. Thông tin trước đây được chuyển tải qua các catalogue dạng bản in thì nay có thể sẽ có trong một catalogue tương tác trên máy tính và được gửi cho khách hàng ở dạng đĩa CD-ROM hay trưng bày trên Website . Ở Việt Nam do đặc điểm về phương thức th ảnh toán bằng tiền mặt nên các hệ thống bán hàng trực tuyến chưa nhiều. Nhưng có thể kể ra một số ví dụ về hệ thống mua bán hàng qua mạng Internet. Vneshop của Việt Nam. Hiện nay hệ thống đang được triển khai tại trung tâm thông tin - Bộ Thương Mại. Trong một số hệ thống thông tin chẳng hạn trong một viện bảo tàng, hệ thống máy tính truyền thông đa phương tiện ngoài việc nhằm nâng cao hiệu quả, giảm bớt chi phí nhân viên thì còn được sử dụng để phân mục các bộ sưu tập giúp người xem có thể dễ đàng tiếp cận với các hiện vật. Hay trong du lịch, để giới thiệu, quảng bá các địa d ảnh, d ảnh lam thắng cảnh, những khu di tích, nếu như bằng phương pháp giới thiệu truyền thống là qua các tranh ảnh, ca-ta-lô quảng cáo sẽ không hiểu qua và sát thực, sức lôi cuốn không cho. Thay vào đó là hệ thống giới thiệu đa phương tiện có đầy đủ âm thanh, hình ảnh, cùng các đoạn video thực tế. Trước mắt người xem đồng thời vừa là các đoạn văn bản, hình ảnh, video, vừa là những khúc hát, những lời giới thiệu đặc thù khiến người xem có cảm giác như đang đi du lịch thật.
  25. 2.3. Truyền thông đa phương tiện trong y học Trong y học người ta đã áp dụng xử lý ảnh với việc hình dung và mô phỏng để hoạch định giải phẫu, điều này giúp các bác sĩ phẫu thuật thực tập được các bước phẫu thuật phức tạp như cắt bỏ khối u não và phẫu thuật định lại cấu trúc não. . . Bác sỹ phẫu thuật có thể dùng các ảnh này để hoạch định và mô phỏng các bước phẫu thuật. Đối với những bệnh dị dạng về xương thì bác sĩ phẫu thuật có thể thí nghiệm bằng vị trí của mắt, ví dụ như thí nghiệm trên máy tính trước khi phẫu thuật. Các thông tin về cấu trúc mặt và xương bình thường có thể được lưu trữ để làm thông tin tham khảo trong tương lai. Ngoài việc lên kế hoạch trước khi phẫu thuật, máy tính cũng có thể được kết nối với phòng mổ trong suốt quá trình giải phẫu. Bác sĩ giải phẫu có thể yêu cầu thực hiện mô phỏng một quy trình phẫu thuật do máy tính thực hiện trước khi bắt tay thực hiện giải phẫu cho bệnh nhân. Ví dụ như bác sĩ cũng có thì yêu cầu máy tính cho biết vị trí của một động mạch. Có thể xoay ảnh 3D đến vị trí giống vị trí của đầu bệnh nhân, lúc đó một phần sọ sẽ bị mất và hệ thống máy tính sẽ phóng lớn vùng bệnh tương ứng. Dưới dây là giới thiệu về bộ tài liệu đa phương tiện của Việt Nam về cấu trúc vùng bẹn & phẫu thuật Shouldice, trong điều trị thoát vị bẹn, đã được thực hiện dưới dạng web và được hỗ trợ thêm nhiều phương tiện khác (sách cầm tay, băng video, VCD, SVCD, DVD, CDROM ) chứa thông tin dạng văn bản, hình ảnh tĩnh, phim và âm thanh; thích hợp cho công tác đào tạo huấn luyện kỹ thuật y khoa cho nhiều loại đối tượng khác nhau. Có thể mở rộng việc sản xuất các bộ lư liệu tương tự cho nhiều chuyên đề khác theo mô hình trên. Góp phần hình thành một hệ cơ sở dữ liệu về các kỹ thuật y khoa, ứng dụng khả năng của mạng intranet và internet phục vụ cho việc đào tạo và tự đào tạo trong ngành y tế.
  26. Phim minh hoạ Phim được lưu trữ tại máy chủ dưới dạng mp4, afs, real . rất nhỏ gọn và tải rất nh ảnh trên internet với dung lượng 0,33MB phút tức khỏang 20MB/giờ Hình 2.10: Truy cập khoảng 1000 địa chỉ website liên quan (ở dạng offline)
  27. Gởi bài viết trả lời thắc mắc, nhận bài viết, thắc mắc Lớp học trực tuyến: Là lớp học ảo trên mạng với nhiều hình thức kết hợp thông tin như video, giọng nói, chat, bảng minh hoạ công cộng. . . thiết kế để chạy trên môi trường intranet và internet. Mô hình này đã thư nghiệm thành công trên mạng intranet TTĐT&BDCBYT
  28. Bảng công cộng: Mọi thành viên trên mạng đều có thể thao tác, sử dụng để minh họa. Tương tự như sử dụng các công cụ vẽ Paint. PhotoShop, CorelDraw. Hình ảnh tự cập nhật khi có sự thay đổi để mọi người Đàm thoại trực tuyến: - Bằng văn bản tương tự dịch vụ chat - Bằng âm thanh tương tự dịch vụ điện thọai Chuyển tài liệu bài viết: Giúp ngườ giảng có thể nhận gợi thông tin. Với các file dạng doc, txt, com, html
  29. Phim trực tuyến - Dạng ASF - Có khả năng truyền trực tiếp hình ảnh giảng viên, các cuộc mo - truyền các băng video minh hoạ từ đầu máy, VCD để giảng dạy Bộ tài liệu này là kết quả của sự tổng hợp kiến thức từ nhiều nguồn như sách báo, và nhất là internet, đảm bảo cung cấp nguồn thông tin đầy đủ và mới nhất. Hơn nữa, bộ tài liệu được thực hiện dưới sự hướng dẫn của nhiều nhà chuyên môn có kinh nghiệm lâm sàng và nghiên cứu khoa học trong lĩnh vực giải phẫu và phẫu thuật vùng bẹn. Vì thế, bộ tư liệu này có một số ưu điểm như sau: • Minh họa rõ cấu trúc ống bẹn bằng phim quay xác thật và mô hình 3 chiều. • Xử ly video hoàn toàn bằng kỹ thuật số trên máy vi tính có trang bị những phần mềm chuyên dụng do đó không cần những máy móc đắt tiền mà vẫn có chất lượng tốt Kỹ thuật này rất thích hợp giúp cho các nước nghèo sản xuất được những nhiều bộ tài liệu tương tự để phục vụ cho việc đào tạo và tự đào tạo. • Là bộ tài liệu kỹ thuật đầu tiên trong nước được thực hiện để phổ biến dưới dạng multimedia trên web kết hợp nhiều phương tiện truyền thông khác (tài liều cầm tay, VCD, SVCD, DVD) tạo hiệu qủa cao và phù hợp với nhiều loại đối tượng có sở thích da dạng và phương tiện khác nhau. • Bộ tài liệu là bước chuẩn bị kỹ thuật thành công ban đầu cho một hệ cơ sở dữ liệu về các kỹ thuật y khoa trên mạng internet nhằm ứng dụng multimedia cho công tác đào tạo và tự đào tạo của cán bộ y tế, nhất là các cán bộ y tế ở vùng sâu vùng xa. 2.4. Truyền thông đa phương tiện trong gia đình Những người sử dụng trong gia đình có lẽ là những người tiêu dùng nhiều nhất của các sản phẩm truyền thông đa phương tiện. Sự gia đời của mạng Internet, khả năng truy cập đến các chương trình truyền hình tương tác và sự gia tăng các PC truyền thông đa phương tiện giá thành thấp đã cho phép thậm chí là những người mới tập sử dụng máy tính cũng có thể tận dụng sức mạnh cua các sản phẩm truyền thông đa phương tiện. Trong gia đình, công nghệ truyền thông đa phương tiện thường được dùng cho các mục đích sau: • Các tài liệu tham khảo • Các chỉ dẫn và các tư liệu tự học • Giải trí Các sản phẩm truyền thông đa phương tiện tự học và hướng dẫn để người sử dụng tự
  30. làm thì có rất nhiều vfa rất đa dạng. Ví dụ, nhiều gia đình có thể sử dụng internet hay một trong các sản phẩm trên đĩa để kết nối đến một công ty đầu tư (chẳng hạn như prudential) để có các hướng dẫn về việc tạo ra một quỹ đầu tư về hưu. Lúc này những công cụ tương tác sẽ hội các câu hỏi về thu nhập, chi dùng, các mục đích chi tài chính dài hạn và sẵn sàng chấp nhận rủi ro. Sau đó chương tình sẽ hiển thị một báo cáo vốn đề nghị sự kết hợp đúng đắn của các khoản vốn đầu tư nhằm đáp ứng nhu cầu của khách hàng. Nhiều sản phẩm còn giúp cho các gia đình đầu tư trực tuyến quản lý qũy đầu tư và đánh giá các khoản vốn đầu tư vào bất kỳ thời điểm nào. Cho đến hiện giờ, ứng dụng lớn nhất của công nghệ truyền thông đa phương tiện dùng trong thương mại là lĩnh vực giải trí. Các trò chơi video bán trong các hộp đĩa và các CD- ROM dành cho các máy chơi trò chơi chuyên dụng hoặc cho các máy tính để bàn hiện tại rất phổ biến. Dung lượng lưu trữ lớn của các CD-ROM thường cho phép chúng chứa các hoạt ảnh chất lượng cao hơn, các đoạn trích video, các đoạn âm thanh chất lượng kỹ thuật số và nhiều công nghệ trò chơi đa dạng. Mặc dù các sản phẩm này đã khá tiện lợi, những người tiêu dùng có vẻ như vẫn còn chờ đợi để được trải nghiệm qua loại hình truyền thông đa phương tiên tốt nhất: truyền hình tương tác trong những năm gần đây người ta đã thực hiện một loạt các công việc để làm cho truyền hình trở thành một quá trình hai chiều thay vì là quá trình một chiều vốn đã từng thoả mãn hàng ngàn những người xem truyền hình lười nhác trong nhiều năm trời. Một dạng cơ bản của truyền hình tương tác là cơ chế trả tiền để xem (pay per view). Một hệ thống dùng cáp chỉ cung cấp các dịch vụ trả tiền để xem qua đường dây điện thoại (ví dụ bạn có thể gọi điện thoại và đặt một bộ phim mới ra gần đây) nhưng cơ chế này không có tính tương tác thực sự. Các hệ thống khác chẳng hạn như các hệ thống vệ tinh, các hệ thống khách sạn và các hệ thống trong gia đình đang ngày càng gia tăng cho phép bạn đặt hàng một bộ phim hay một chương trình trả tiền để xem thông qua bộ điều khiển từ xa của bạn hoặc các thiết bị chuyển đổi tín hiệu cáp đặc biệt.
  31. CHƯƠNG III CÁC YÊU CẦU CỦA HỆ THỐNG ĐA PHƯƠNG TIỆN 3.1. Yêu cầu của ứng dụng đa phương tiện trên máy đơn Vì khối lượng của các thông tin kỹ thuật số dùng để xây dựng mỗi một giây trong một chương trình là rất nhiều, các nhà chế bản truyền thông đa phương tiện luôn phải xem xét đến thiết bị của người sử dụng - đó là phần cứng mà thông tin sẽ hiển thị trên đó. Các PC hiện đại thường được gắn đủ tất cả các thành phần truyền thông đa phương tiện cần thiết. Những máy tính này giúp cho người mới học dùng máy tính, hay những người sử dụng máy tính trong gia đình có thể bỏ bớt khoảng thời gian để làm quen ban đầu bởi người sử dụng không phải đối mặt với các vấn đề phần cứng phức tạp chẳng hạn như cấu hình một ổ đĩa CD - ROM. Cài đặt một bộ mạch âm thanh đối với các máy tính cũ hơn có thể ta phải thêm một hay một số thành phần sau để biến một PC thành một PC truyền thông đa phương tiện: • Sound Card (bộ mạch âm thanh) • Loa • CD-ROM, DVD drive • Microphone • Camera • Một số thiết bị chuyên dụng khác Một máy tính truyền thông đa phương tiện cũng cần có đủ sức mạnh xử lý (CPU tốc độ nh ảnh) và bộ nhớ (RAM) để chứa các chương trình truyền thông đa phương tiện vốn rất thiết bị xử lý và bộ nhớ lớn của máy tính. Cùng với sự phát triển các ứng dụng truyền thông đa phương tiện, sự gia tăng các tính năng của các máy tính cùng với yêu cầu giảm thiểu chi phí cho người sử dụng: các tổ chức công nghiệp đã đưa ra các yêu cầu về tiêu chuẩn tối thiểu đối với các PC truyền thông đa phương tiện. Và càng ngày các yêu cầu này càng trở nên nghiêm ngặt hơn. Vào đầu thập niên 90, các công ty phần cứng và phần mềm bắt đầu phát triển tiêu chuẩn máy tính cá nhân truyền thông đa phương tiện (Multimedia Prersonal Computcr - MPC) quy định yêu cầu tối thiểu về phần cứng đối với các máy tính cá nhân để được gọi là máy tính có đầy đủ tính năng truyền thông đa phương tiện, phiên bản cuối cùng của tiêu chuẩn MFC được gọi là MFC mức 3 ra đời năm 1995 quy định cầu hình tối thiểu cho máy tính cá nhân truyền thông đa phương tiện như sau: • Có ít nhất 8 MB RAM • Ổ cứng (HDD) 540 MB • Bộ xử lý (CHIP) 75 MHz
  32. • Một ổ CD-ROM tốc độ 4X và có hỗ trợ các tập tin dạng thức MPEG. Tuy nhiên ngày nay các PC đều vượt qua cấu hình này khiến cho tiêu chuẩn MPC mức 3 trở nên lỗi thời. Gần đây các nhà phát triển phần cứng và phần mềm, mà tiêu biểu là Microson Và Intel tiếp tục phát triển tiêu chuẩn phần cứng cho máy tính cá nhân. Bắt đầu với tiêu chuẩn PC 97, các yêu cầu cấu hình thay đổi tuỳ theo công dụng của PC, ví dụ cấu hình chuẩn cho một PA căn bản thì khác với một PC để giải trí. Các yêu cầu của PC 97 cho một PC căn bản cao hơn các yêu cầu của MPC mức 3: • Có ít nhất 16 MB RAM • Vi xử lý (CHIP) 120 MHz • Có ít nhất một cổng USB Tiếp theo sau PC 97 là PC 99, nâng mức giới hạn đối với các PC cao hơn nữa: Đặc tính PC cơ bản PC giải trí Tốc độ xử lý 300 MHz 300 MHz RAM 32 MB 64MB Số cổng USB tối thiểu 2 2 CD, DVD, Modem hay các thiết bị truyền thông đa Phải có phải có phương tiện thông mạng công cộng Hỗ trợ bo mạch thông minh (Smart Card) Phải có Phải có Đầu xuất ra TV Nên có Nên có Bộ điều hợp mạng Nên có nên có Bộ chỉnh tín hiệu truyền hình kỹ thuật tương tự (Analog Nên có Nên có television) Hỗ trợ cho IEE: 1394 Nên có Nên có 3.2. Chất lượng dịch vụ trong các hệ thống Multimedia Thuật ngữ “chất lượng của một sản phẩm” sử dụng trong cuộc sống hàng ngày được hiểu một cách đơn giản là mức độ tốt vốn có của sản phẩm. Trong công nghiệp, chất lượng được định nghĩa một cách chính xác hơn là: “sự phù hợp với các yêu cầu khi được đưa vào sử dụng". Các hệ thống multimedia xử lý dữ liệu liên tục (như là video, âm thanh), và dữ liệu rời rạc được mã hoá (như là đồ hoạ, text), do đó đòi hỏi các hệ thống multimedia phải thỏa mãn các yêu cầu về chất lượng dịch vụ nhất định để đáp ứng yêu cầu của người sử dụng. Chất lượng dịch vụ phụ thuộc vào loại phương tiện được sử dụng, khuôn dạng dùng để mã hoá dữ liệu, ứng dụng và loại ứng dụng. Ví dụ, chất lượng dịch vụ của một hội thảo video thì khác so với QoS của một ứng dụng phục hồi dữ liệu video, bởi vì trong một cuộc hội thảo video thì yêu cầu về thời gian trễ là nhỏ, còn trong ứng dụng phục hồi dữ liệu thì điều này không quá quan trọng. Mặc khác, các mức hệ thống khác nhau cũng yêu cầu QoS không giống nhau. Ví dụ,
  33. trong một hệ thống liên lạc, mô tả QoS ở lớp ứng dụng thường yêu cầu cao hơn so với mô tả QoS ở lớp mạng. Tuy nhiên, các tham số QoS như lả băng thông, độ trễ, thì có mặt trong tất cả các lớp, Để đảm bảo các yêu cầu QoS của các ứng dụng trong các hệ thống multimedia, trước tiên ta cần phải biết được tất cả các tài nguyên mà các ứng dụng sử dụng, bao gồm các tài nghiên xử lý cục bộ và các tài nguyên hệ thống dùng để truyền một luồng media: • Băng thông • Các thiết bị vào ra, bao gồm cá các ổ đĩa cứng chứa file hệ thống • Network adapter và các tài nguyên mạng dùng để truyền các gói dữ liệu giữa các node • Các CPU dùng để chạy ứng dụng và phần mềm giao thức • Bộ đệm dùng để lưu trữ phần mềm và dữ liệu Các tài nguyên đó thường được chia thành 2 loại: • Tài nguyên động: CPU, bus, network adapter, các hệ thống vào ra, đường truyền • Tài nguyên tĩnh: bộ nhớ của các host, các hệ thống trung gian như là router, hoặc switch (xem hình 3.1). Để phân phối một mức QoS cụ thể đến một ứng dụng, hệ thống phải có các tài nguyên phù hợp, và các tài nguyên đó cần có cơ chế quản lý hiệu quả để sẵn sàng phục vụ ứng dụng khi ứng dụng cần sử dụng các tài nguyên đó. Trong nhiều hệ thống máy tính ngày nay, chất lượng và chất lượng của các luồng multimedia bị hạn chế do thiếu cơ chế quản lý tài nguyên phù hợp dẫn đến sự khan hiếm tài nguyên sử dụng ( như trong hình 3.2)
  34. Qua hình vẽ chúng ta thấy rằng, do sự phát triển các công nghệ, các tài nguyên hệ thống đã dần dần đáp ứng được các yêu cầu của các ứng dụng mới, tuy nhiên vẫn tồn tại sự khan hiếm tài nguyên, do đó việc xây dựng một cơ chế thích hợp để quản lý các tài nguyên là rất cần thiết. Mặt khác, QoS phần nào phụ thuộc vào nhà cung cấp dịch vụ và người sử dụng dịch vụ. Trong khi người sử dụng dịch vụ muốn sử dụng được nhiều tài nguyên với chi phí thấp nhất có thể, thì nhà cung cấp lại muốn tối thiểu hoá tài nguyên sử dụng và tối đa hoá lợi nhuận thu được. Do đó, để đảm bảo yêu cầu về QoS cũng cần có những thương lượng cần thiết để đảm bảo mục đích chung. Đặc tả QoS Mục đích của đặc tả QoS một mặt nhằm cho phép các ứng dụng xây dựng các yêu cầu QoS của chúng mặt khác các thành phần hệ thống cung cấp QoS chấp nhận đặc tả yêu cầu QoS như là một yêu cầu cho một dịch vụ nhất định. Về mặt bản chất, đặc ta QoS là các khai báo được cho dưới dạng một tập các tham số. Các tham số thường được xem xét bao gồm: (xem hình 3.3) • Thông lượng • Độ trễ • Tỷ lệ lỗi Trong đặc tả yêu cầu, giá trị của các tham số có thể là: • Giá trị đơn: xác định mức yêu cầu cụ thể của một tham số • Một cặp giá trị: đưa ra giá trị tối thiểu có thể chấp nhận được và giá trị kì vọng trung bình của một tham số • Khoảng giá trị: khoảng nằm giữa giá trị nhỏ nhất và giá trị lớn nhất có thể chấp nhận được của tham số được xét. (minh hoạ trong hình 3.4)
  35. CHƯƠNG IV MỘT SỐ DỮ LIỆU ĐA PHƯƠNG TIỆN 4.1. Ảnh 4.1.1. Ảnh và ứng dụng Hiện tại người ta đòi hỏi các ứng dụng máy tính xu là nhiều loại ảnh khác nhau trong nhiều ứng dụng khác nhau. Nhu cầu của họ thay đổi tuỳ theo loại ảnh cần hỗ trợ. Ảnh bitonal (trắng và đen) bao gồm văn bản trong các tài liệu kinh do ảnh như thư từ hay các giấy khổ A4. Thông thường những ảnh này được quét và lưu trữ trong file folder để sử dụng trong các ứng dụng. Công nghệ lưu trữ và quét quang học cũng đang thay thế microform trong hệ quản lý hồ sơ, nơi lưu trữ các tài liệu như bằng sáng chế, báo cáo y khoa, mẫu đơn thức và báo cáo ngân hàng. Những đề mục nhỏ như biên lai. séc và thẻ tiện dụng được xử lý trong hệ thống sử lý giao dịch khối lượng lớn. Một loại ảnh bitonal thứ 2, được gọi là line art, bao gồm các đồ hoạ kỹ thuật trong ứng dụng thiết kế được máy tính hỗ trợ (CAD), biểu đồ trong sổ tay kỹ thuật dành cho lĩnh vực quốc phòng và hàng không, lược đồ, lưu đồ, sơ đồ mạch, bản đồ và hoạt hình. Một số tài liệu kinh do ảnh như đơn từ, là tổng hợp nhiều dòng, văn bản in và menusceript, để xử lý những ảnh như vậy cần phải sử dụng hỗn hợp công nghệ nhận dạng và quét. Ảnh chụp, ảnh nửa tông hoặc khung đơn là các loại ảnh tông liên tục có thang độ xám hoặc mầu. Ảnh thang độ xám chứa đựng nhiều bóng xám. Chúng được sử dụng trong các ứng dụng như dàn trang và các thư viện cho việc biên soạn và phát hành các bài báo hay các ứng dụng về khoa học kỹ thuật như không ảnh, thông tin vệ tinh và dữ liệu về động đất. Thông thường các ứng dụng này yêu cầu ảnh phải có chất lượng cao hơn ảnh hệ thống sử lý tài liệu đã được đề cập trước đó. Chẳng hạn, nhờ vào các ảnh y khoa chụp từ máy quét ảnh cộng hưởng từ MRI và máy quét chụp cắt lớp bằng tia X dưới sự hỗ trợ của máy tính, các bác sĩ có thể chẩn đoán bệnh từ xa thông qua tia phóng xạ. Các ứng dụng chuyển biết được thiết lập riêng cho loại ảnh màu (đa quang phổ) chẳng hạn như sách cũ và bản thảo như ở thư viện hoặc ảnh hội hoạ chất lượng cao cả các đề mục trưng bày trong viện nghệ thuật và viện bảo tàng. Nhu cầu về ảnh chụp có màu trong hệ thống truyền thông đa phương tiện thường ngày như các loại ứng dụng cũng tăng lên. Điển hình là hiện thời, người tiêu dùng và các chuyên gia có thể xử lý và lưu trữ ảnh màu trên đĩa compact ảnh để sau đó hiển thị chúng trên màn hình máy tính hoặc truyền hình. Trong các buổi trình bày trong kinh do ảnh, các do ảnh nghiệp có thể sử dụng bộ sưu tập ảnh trên đĩa mềm hoặc CD-ROM. Ảnh có thể được ứng dụng vào nhiều lĩnh vực hiện đại hơn nữa, tuy nhiên nếu kết hợp giữa ảnh và các công nghệ khác, chẳng hạn như hệ cơ sở tri thức và thuật toán so khớp mẫu - con người sẽ bước vào kỷ nguyên dần triển vọng hơn và sự kết hợp đó phục vụ cho quá trình diều tra và phát triển, chẳng hạn như dấu tay và ảnh chụp có mục đích nhận diện trong an ninh.
  36. 4.1.2. Thu ảnh Thông thường hầu hết các loại ảnh đề cập như trên đều được thu giữ bằng máy chụp hay máy quét quang học có công dụng chuyển đổi ảnh vào mảng điểm hình chữ nhật gọi là các phần tử ảnh (pixels). Hệ quét quang học bao gồm một nguồn sáng, một giá đỡ tài liệu và một bộ dò ánh sáng. Sau mỗi lần chạy, ánh sáng phản xạ được chuyển đổi thành tín hiệu điện, và sau đó sẽ được chuyển đổi dạng số để xử lý và lưu trữ thành mảng phần tử ảnh, kích thước của mảng này phụ thuộc vào loại ảnh được thu: • Ảnh bitonal chỉ có giá trị cường độ và do đó có lúc lưu giữ một bit một phần tử ảnh với giá trị là 1 hoặc 0. • Ảnh thang độ xám có nhiều mức xám. Ảnh được lưu giữ trong n bit một phần tử ảnh, nơi mà tổng số độ xám là 2n - 1 (ví dụ, 1 ảnh có 15 độ xám + trắng cần được lưu giữ trong 4 bit một phần tử ảnh). • Cường độ của ba màu chính và màu xám định rõ đặc điểm của ảnh màu. Số lượng màu hiện có trong n bit là 2n -1 (ví dụ, cần 8bit một phần tử ảnh để lưu trữ một ảnh chứa 25màu + trắng). Kích thước của mảng cũng phụ thuộc vào mật độ, đó là số lượng phần tử ảnh có trong 2.54cm theo một hướng. 'rhuậl ngữ mật độ cũng được dùng để mô tả độ phân giải của máy quét lính theo số lượng diềm trong 2.54cm (dpi). Khi lựa chọn độ phân giải, cần phải xét đến độ phân giải của thiết bị xuất bởi vì chúng có mỗi quan hệ lẫn nhau. Chẳng hạn, độ phân giải của màn hình hiển thị máy tính nằm giữa 70 và 200 dpi. của máy in laze thông thường là 300 dpi, nhưng của máy in offset lên dấn 1000 dpi. Tốc độ thu giữ ảnh cũng thay đổi từ 3 trang A4 trong một phút (đối với loại máy quét để bàn dùng cho máy tính cá nhân) dấn 30 trang A4 một phút (đối với loại máy quét tốc độ cao). Loại máy quét như thế thu ảnh của cả những đề mục nhỏ như biên lai, tín dụng hay chi phiếu séc phục vụ cho quá trình xử lý nghiệp vụ. Để thu ảnh, người ta cũng sử dụng loại máy quay số có độ phân giải cao - chẳng hạn như dùng 2 máy camera thu đồng thời nửa phần dưới của tài liệu để đạt tốc độ yêu cầu. Các mảng của thiết bị nạp phát (CCDS) được lắp đặt trong kiểu máy camera như thế. Đối với loại ảnh có độ phân giải cao (tới 2200x1700) trong lĩnh vực nghệ thuật màu, người ta sử dụng máy quay ảnh hiện có thu giữ, cũng có thu được khung tĩnh từ chuỗi video động bằng bộ số hoá video hay bằng bộ chộp khung. Cần phải lắp đặt các thiết bị đặc biệt đa số hoá ảnh quét MRI và CT, giúp cho các bác sĩ có thể chẩn đoán thông qua ảnh quét được hiển thị trên màn hình có độ phân giải cao (2500 x 2000 phần tử có 256 độ xám). Thiết bị ra ảnh có thể là máy in đen trắng, máy in màu hay máy vẽ (ploter). Nhìn chung, các hệ thống thu nhận ảnh thực hiện hai quá trình: • Cảm biến: biến đổi năng lượng quang học (ánh sáng) thành năng lượng điện • Tổng hợp năng lượng điện thành ảnh 4.1.3. Kĩ thuật nén 4.1.3.1. Tại sao phải nén
  37. Cần rất nhiều byte để hiển thị một ảnh chưa nén. Lấy một mặt giấy A4 làm ví dụ. Như mô tả ở trên, máy quét có thể thu thông tin trên giấy theo thang độ xám hay bitonal. Sau đó dữ liệu qua thường được lưu giữ tạm thời trên đĩa từ, Bảng 7.1 cho thấy số lượng không gian lưu trữ mà tài liệu này chiếm khi nó được quét với mức độ 200, 300, và 400 dpi. Bảng 3.1 - Yêu cầu lưu trữ của khổ giấy A4 chưa nén Độ phân giải dpi Bitonal (Mb) Thang độ xám (Mb) Màu sắc (Mb) 200 0,48 1,9 – 7,7 15 – 61 300 1,09 4,4 – 17,4 35 – 140 400 1,93 7.7 – 30,9 62 – 247 Trong đó: 1 tờ giấy A4 có kích thước 210 x 297mm hoặc 8,27 x 11,69mm Ảnh bitonal cần 1 bit / một phần tử Ảnh thang độ xám cần 4 - 6 bit / phần tử ảnh Ảnh màu cần 32 - 128 bit / 1 phần tử ảnh Để giảm bớt khoảng không lưu trữ tài liệu, ảnh phải được chuyển đổi sang dạng khác và nhỏ hơn bằng cách loại bỏ những thông tin dư thừa. Nói 1 cách khác, ảnh cần phải được nén lại để giảm không gian lưu trữ. Một số phương pháp nén ảnh sẽ được trình bày chi tiết trong các phần tiếp theo. 1.1.3.2. Nén ảnh, JPEG Công nghệ nén ảnh JPEG (Joint Photographic Experts Group) là một trong những công nghệ nén ảnh hiệu qủa, cho phép làm việc với các ảnh có nhiều màu và kích cỡ lớn, tỷ lệ nén ảnh đạt mức so sánh tới vài chục lần (chứ không phải phần trăm). Tuy nhiên được cái này bạn phải mất cái khác, đó là quy luật cộng trừ tự nhiên. Thông thường các ảnh màu hiện nay dùng 8 bit (1 byte) hay 256 màu thay cho từng mức cường độ của các màu đỏ, xanh lá cây và xanh da trời. Như thế mỗi điểm của ảnh cần 3 bức để lưu mã màu, và lượng byte một ảnh màu này chiếm gấp 24 lần ảnh trắng đen cùng cỡ. Với những ảnh này các phương pháp nén ảnh như IFF (Image File Format) theo phương pháp RLE (Run Length Encoding) không mang lại hiệu quả vì hệ số nên chỉ đạt tới 2:l hay 3:1 (tất nhiên là kết quả nên theo phương pháp RLE phụ thuộc vào cụ thể từng loại ảnh, ví dụ như kết quả rất tốt và các loại ảnh ít đổi màu). Ưu điểm cao của phương pháp nào là ảnh đã nên sau khi bung sẽ trùng chớp với ảnh ban dầu. Một số phương pháp nén khác không để mất thông tin như của Lempel - Ziv - Welch (LZW) có thể cho hệ số nén tới 6:1. Nhưng như thế cũng chưa thật đáp ứng yêu cầu đòi hỏi thực tế. Phương pháp nén ảnh theo thuần JPEG có thể cho hệ số nén tới 80:l hay lớn hơn, nhưng bạn phải chịu mất thông tin (ảnh sau khi bung nén khác với ảnh ban đầu), lượng thông tin mất mát tăng dần theo hệ số nên. Tuy nhiên sự mất mát thông tin này không bị làm một cách cẩu JPEG tiến hành sửa đổi thông tin ảnh khi nén sao cho ảnh mới gần giống như ảnh cũ, khiến phần đông mọi người không nhận thấy sự khác biệt. Và bạn hoàn toàn có thể quản lý sự mất mát này bằng cách hạn chế hệ số nén. Như thế người dùng có thể cân nhắc giữa cái lợi của việc tiết kiệm bộ nhớ và mức độ mất thông tin của ảnh, để chọn phương án thích hợp.
  38. Phương pháp nén ảnh JPEG dựa trên nguyên lý sau: ảnh màu trong không gian của 3 màu RGB (reo Green Blue) được biến đổi về hệ YUV (haiy YCBCr) (điều này không phải là nhất thiết, nhưng nếu thực hiện thì cho kết qủa nén cao hơn). Hệ YUV là kết quả nghiên cứu của các nhà sản xuất vô tuyến truyền hình hệ Pal, Secam và NTSC, nhận thấy tín hiệu video có thể phân ra 3 thành phần Y, U, V (cũng như phân theo màu chuẩn đỏ, xanln lá cây và xanh da trời). Và một điều thú vị là hệ nhãn thị của con người rất nhạy cảm với thành phần Y và kém nhạy cảm với hai loại U và V, phương pháp JPEG đã nắm bắt phát hiện này để tách những thông tin thừa của ảnh, hệ thống nén thành phần Y của ảnh với mức độ ít hơn so với U, V, bởi người ta ít nhận thấy sự thay đổi của U và V so với Y. Giai đoạn tiếp theo là biến đổi những vùng thể hiện dùng biến đổi cosin rời rạc (thông thường là những vùng 8 x 8 pixel). Khi đó thông tin về 64 pixel ban đầu sẽ biến đổi thành ma trận có 64 hệ số thể hiện "thực trạng" các pixel. Điều quan trọng là ở đây hệ số đầu tiên có khả năng thể hiện "thực trạng" cao nhất, khả năng đó giảm rất nhanh với các hệ số khác. Nói cách khác thì lượng thông tin của 64 pixel tập trung chủ yếu ở một số hệ số ma trận theo biến đổi trên. Trong giai đoạn này có sự mất mát thông tin, bởi không có biến đổi ngược chính xác. Nhưng lượng thông tin bị mất này chưa đáng kể so với giai đoạn tiếp theo. Ma trận nhận được sau biến đổi cosin rời rạc được lược bớt sự khác nhau giữa các hệ số. Đây chính là lúc mất nhiều thông tin vì người ta sẽ vứn bỏ những thay đổi nhỏ của các hệ số. Như thế khi bung ảnh đã nén bạn sẽ có được những tham số khác của các pixel. Các biến đối trên áp dụng cho thành phần U và V cua ảnh với mực độ cao hơn so với Y (mất nhiều thông tin của U và V hơn). Sau đó thi áp dụng phương pháp mã hóa của Hoffman: phân tích dãy số, các phần tử lặp lại nhiều được mã hóa bằng ký hiệu ngắn (marker). Khi bung ảnh người ta chỉ việc làm lại các bước trên theo quá trình ngược lại cùng với các biến đổi ngược. Vì phương pháp này thực hiện với các vùng ảnh (thông thường là 8 x 8 pixel) nên hay xuất hiện sự mất mát thông tin trên vùng biên của các vùng (block) này. Hiện nay người ta dã giải quyết vấn đề này bằng cách làm trơn ảnh sau khi bung nén để che lấp sự khác biệt của biên giới giữa các block. Một hệ nén ảnh theo chuẩn JPEG cùng algorithm làm trơn ảnh đã được công ty ASDG đưa ra trong hệ Art Department Professional. 4.1.3. Nén Fractal Tất cả các phương pháp nén ảnh đều dựa trên một nguyên lý đơn giản: trong dữ liệu có nhiều phần tử thừa và nén ảnh dựa trên cơ sở tìm ra những phần tử đó và mã hóa chúng. Ví dụ. như số 9999997777 có thể mã hóa thành 6947. Các hình ảnh trên màn hình máy vi tính đặc trưng bởi số điểm (pixel) là số bit dành cho mã mầu của mỗi điểm (bit/pixel). Phần lớn các hình ảnh (nhất là có độ phân giải cao) không có quy luật giữa các điểm gần nhau, do đó các phương pháp thông dụng hiện nay như biến đổi cosin rời rạc. Wavelet Image Compession (WIC) (theo chuẩn JPEG và MPEG) phải dùng đến biến đổi toán học và xấp xỉ các mối tương quan giữa các pixel. Với các phlương pháp nén ảnh rractal bạn có thể nén ảnh tới tỷ lệ 20:1 - 30:1. Nhưng những ảnh này (vì bị mất thông tin) chỉ là những ảnh gần đúng với ảnh ban đầu, ngoài ra còn có thể xuất hiện biến dạng hình ảnh như đối với phương pháp biến đổi cosin rời rạc. a. hình học Fractal và biến đổi Fractal
  39. Một cuộc cách mạng trong vấn đề xử lý ảnh ghế giới thực" đã xảy ra cùng với sự ra đời cuốn sách " Hình học Fractal của tự nhiệm (the Fractal Geometry of Nature) của tác giả Mandelbrot. Theo tác giả, khái niệm Fractal là cấu trúc thể hiện sự gần giống nhau về hình dạng cua các hình thể kích cỡ khác nhau. Nếu bạn nghiền một củ khoai tây rán dòn bạn sẽ có vô số những mảnh vỏ lớn nhỏ, các mảnh này có thể gọi là Fractal, Mandelbrot chỉ ra rằng. Có thể tìm ra các câu trúc và qui luật để tạo các hình dạng Fractal, do đó có thể coi Fractal như là các hình cơ bản của hình học phẳng Ơ-cơ-lit cùng với đường thẳng, hình chữ nhật. hình tròn. Fractal không phụ thuộc vào độ phân giải của hình, đó là những hình ảnh nhỏ, có thể vẽ được bằng một bộ hữu hạn thuật toán như quay hình, co dãn, biến đổi từ một hình nào đó. Các phép toán trên thực hiện với các hệ số được gọi là hệ số affin. Một bức tranh có thể được Fractal hóa và ta có thể khôi phục nó ngòi các hệ số affins. Trên thực tế đối với các hình rất ngẫu nhiên thì các hệ số gian tìm được rất khó. Trước kia linh bằng tay, người ta phải mất hàng ngày, hàng tuần. Hiện nay công việc đó có thể làm trong 5 phút. Quá trình Fractal hóa đã được hãng Integrated Systems nghiên cứu và giữ bản quyền. Sau đây là một số bước của quá trình đó. b. Nén hình ảnh Chia ảnh thành những vùng không phủ nhau còn gọi là domen (chẳng hạn bằng các đường thẳng ngang và đứng). Các vùng này phải phủ kín hình ảnh. Lấy bộ các vùng cơ sở, các vùng này không nhất thiết phủ kín bề mặt bức tranh. Thực hiện biến đổi Fractal. Với mỗi vùng domen ta tìm vùng cơ sở mà sau biến đổi affin xấp xỉ nhất với domen. Lưu các hệ số nhìn vào file, File này gồm 2 phần: đầu thể chứa thông tin về vị trí các domen và vùng cơ sở sau đó là bảng các thông số affin cho từng domen. c. Vẽ lại hình ảnh Tạo hai hình ảnh cùng cỡ A và B. Cỡ các ánh này có thể khác với ảnh ban đầu. Các ảnh này có thể là trắng hay đen. Biến đổi các điểm của A vào B. Để làm điều đó trước hết chia D thành các domen như quá trình nén ảnh trên, với mỗi domen của B ta thực hiện biến đổi affin áp dụng với vùng cơ sở A (Các hệ số affin lấy từ file). Kết quả có được ta ghi vào B. Biến đổi giá trị của B vào A giống như lần trước, chỉ có điều đổi vị trí chúng. Thực hiện biến đổi trên nhiều lần cho đến khi A và B không khác gì nhau. Quá trình này dẫn đến việc là ta khôi phục được bức tranh ban đầu mà độ chính xác phụ thuộc vào độ chính xác của các biến đổi affin. Thuật toán quá trình nén và giải nén ảnh được công ty Integrated Systems đưa ra sử dụng số học nguyên cùng các phương pháp làm giảm sự tăng dần của sai số trong các phép toán làm tròn. Các thuật toán đã được tối ưu về mặt thời gian thực hiện. Tuy thế quá trình nén ảnh đó phải thực hiện một khối lượng tính toán lớn nên đòi hỏi khá nhiều thời gian so với việc giải nén ảnh. Với máy 386, tốc độ 33MHz và màn hình VGA các trình thí nghiệm đã thử phim video màu với tốc độ 20 ảnh loại này trong một giây. d. Những ưu điểm của phương pháp Fractal Trong quá trình Fractal hóa, bạn sẽ nhận được bộ các chữ số rất nhỏ thể hiện hình ảnh. Do đó hệ số nén của phương pháp là rất lớn, tuy thế chất lượng ảnh sau khi nén được bảo đảm
  40. khá chính xác. Phương pháp rất hiệu quả với những ảnh có độ phân giải cao. Phương pháp này dã được áp dụng không những trong nén dữ liệu mà còn để thể hiện các mối quan hệ giữa các phần tư của các ảnh xạ. 4.2. Âm thanh 4.2.1. Các ứng dụng âm thanh Âm thanh đóng vai trò quan trọng trong các ứng dụng truyền thông đa phương tiện. Các hiệu ứng đặc biệt của như âm nhạc và tiếng nói có thể được đưa vào các ứng dụng, đặc biệt là các ứng dụng trong hệ thống đào tạo và bán hàng tự động hoặc hệ thống điểm thông tin. Một lời chú thích bằng tiếng nói có thể được dùng để diễn tả những gì đang diễn ra trên màn hình hoặc để làm nổi bật và nhấn mạnh những khái niệm then chốt. Âm thanh có thể được sử dụng kết hợp với hình ảnh tĩnh hoặc động để giải thích cho người sử dụng một ý tưởng hay một quy trình hiệu quả hơn theo cách giải thích chỉ đơn giản bằng văn bản hay đồ hoạ, âm nhạc có thể được sử dụng để thu hút sự chú ý của khách hàng hoặc để tạo ra được một phong cách riêng biệt. Trong một sô lĩnh vục chuyên dụng tự âm thanh có thể hình thành nên được cái lôi của một ứng dụng truyền thông đa phương tiện, chẳng hạn như các hệ thống giúp cho người tàn tật nhìn thân được. Một dự án mới đây đã đưa đến việc chuyển tải nhật báo đến một thiết bị máy tính đặt tại nhà người sử dụng. Chỉ cần ngôi ở nhà, người sử dụng có thể chọn nghe hệ thống xử lý tiếng nói đọc lớn các bài báo đã được chọn lọc hoặc cho các bài báo đó hiển thị trên màn hình với kiểu chữ lớn. Một khi chi phí giảm và công nghệ được cải tiến thì mối quan tâm cua người dùng đến việc sử dụng hệ thống xử lý và nhận dạng tiếng nói trong các ứng dụng kinh doanh nói chung sẽ tăng lên. 4.2.2. Ghi âm thanh Bộ số hoá âm thanh được sử dụng để ghi và số hoá âm thanh tương tự từ băng âm thanh, đĩa ghi, CD-ROM và phiên bản đĩa compact audio gốc hay CD-DA ( compact âm thanh kĩ thuật số). Có thể dùng micro để thu lại nhạc gốc hoặc sử dụng các nhạc cụ được cài sẵn trong máy tính để soạn nhạc thông qua giao diện MIDI. Sau khi âm thanh được thu, âm thanh sẽ được lưu trữ ở đĩa cứng hoặc ở môi trường quang học. Nó có thể được hiệu chỉnh và phát lại qua bộ loa nối với máy tính hoặc qua tai nghe. Hiện tại máy tính có bộ xử lý âm thanh và loa cài sẵn trong máy. Tuy nhiên, hệ thống loa riêng biệt bên ngoài sẽ phát ra âm thanh hay hơn. Nếu nguồn âm thanh là ổ đĩa compact riêng cần phải kết nối với loa (hình 4. 1 :)
  41. 4.2.3. Kĩ thuật nén Do con người dễ nhạy cảm với những thay đổi về chất lượng âm thanh hơn là chất lượng hình ảnh nên đòi hỏi cần phải có các hệ thống truyền thông đa phương tiện để hỗ trợ các chuẩn âm thanh cao. Hiện nay các kỹ thuật dùng để mã hoá thông tin đã được phát triển rất tốt. Âm thanh được tạo ra từ các vi sai áp suất trong không khí. Micro tiếp nhận những vi sai này và phát ra thông qua bộ khuếch đại. Đầu tiên, tín hiệu tương tự này được số hoá bằng bộ chuyển mã tương tự sang tín hiệu số (ADC). Sau đó máy tính lấy mẫu dạng sóng nhập vào theo những khoảng cách đều đặn, rồi sử dụng phương pháp điều biến mã xung (PCM) để chuyển đổi biên độ sang mã nhị phân. Đối với tiếng nói, tốc độ lấy mẫu là 8kHz và 8 bit - đại diện cho 256 giá trị biên độ khác nhau - được dùng để mã hoá mỗi mẫu. Kĩ thuật giới hạn số lượng như thế này được gọi là phép lượng tử hoá. Phương pháp mã hoá này sẽ tạo ra một dòng dữ liệu âm thanh liên tục 64.000 bit trong một giây (64kbit/s), sau đó được xếp thành từng bó tin để truyền qua mạng. Đối với loại nhạc có chất lượng phát từ đĩa compact, tốc độ lấy mẫu của tín hiệu là 44, 1 kHz và dùng 1 6 bit để giải mã mỗi mẫu. Trong hệ âm thanh nổi, phương pháp mã hoá này sẽ tạo dòng dữ liệu âm thanh liên tục 1,4 triệu bit trong 1 giây. Việc loại bỏ yên lặng hay dùng các phương pháp mã hoá tốt hơn thì có thể đạt được độ nén cao hơn nữa: Phương pháp PCM phi tuyến ấn định các điểm giá trị biên độ phi tuyến. PCM sai phân mã hoá vi sai của tín hiệu thay chỉ vì mã hoá tín hiệu này. Dãy vi sai thường nhỏ hơn dãy biên độ . Phương pháp điều biến mã xung không tương ứng (ADPCM) điều chỉnh động dãy giá trị biên độ để tương ứng với dãy biên độ có trong dòng dữ liệu nhập.
  42. 4.3. Video 4.3. 1. Các ứng dụng video Các ứng dụng video được chia thành 2 nhóm: Nhóm phát lại chất liệu nghe nhìn: Nhóm truyền thông nghe nhìn ở thời gian thực 4.3.2. Nén video Kỹ thuật nén ảnh số đang đóng một vai trò cực kỳ quan trọng trong các hệ thống viễn thông và multimedia để giải quyết vấn đề băng thông của đường truyền. Các kỹ thuật nén video đều cố gắng làm giảm lượng thông tin cần thiết cho một chuỗi các bức ảnh mà không làm giảm chất lượng của nó đối với người xem. Nói chung, tín hiệu video thường chứa đựng một lượng lớn các thông tin thừa, chúng thường được chia thành hai loại: thừa tĩnh bên trong từng frame (statistical) và thừa động giữa các frame (subjective). Mục đích của nén video là nhằm làm giảm số bit khi lưu trữ và khi truyền bằng cách phát hiện để loại bỏ các lượng thông tin dư thừa này và dùng các kỹ thuật Entropy mã hoá để tối thiểu hoá lượng tin quan trọng cần giữ lại. Nén dữ liệu được chia thành hai dạng cơ bản: Nén không mất dữ liệu (Lossless) và nén có mất dữ liệu (Lossy). Đối với dạng nén không mất dữ liệu, ảnh được khôi phục hoàn toàn giống ảnh gốc, tuy nhiên điều này đòi hỏi phải có thiết bị lưu trữ và đường truyền lớn hơn. Các thuật toán của nén không mất dữ liệu thường dựa vào việc thay thế một nhóm các ký tự trùng lặp bởi một nhóm các ký tự đặc biệt khác ngắn hơn mà không quan tâm tới ý nghĩa của dòng bộ dữ liệu. Các ví dụ của dạng nén không mất dữ liệu là Run-length Encoding (RLE), Huffman Coding, Arithmetic coding, Shannon-Fano Coding, tz78, LZH, LZW Đối với dạng nén có mất dữ liệu, ảnh được khôi phục không giống hoàn toàn với ảnh gốc, dạng nén này thích hợp cho việc lưu trữ và truyền ảnh ảnh, video qua một mạng có băng thông hạn chế. Các dạng nén này thường cho hệ số nén cao hơn, nó liên quan tới việc dùng các phép biến đổi tín hiệu từ miền này sang miền khác. Các ví dụ của biến đổi có mất dữ liệu gồm: Differential Encoding, Discrete Cosine Transform(DCT), Vector Quantization, JPEG (Joint Photographic Experts Group) và MPEG (Motion Picture Experts Group). Các phương pháp nén ảnh có mất tín hiệu gồm có 4 bước như hình 4.2. Ảnh gốc được biến đổi theo nhiều cách khác nhau. Vào những năm 1980, việc nén và giải nén tín hiệu video dựa trên kỹ thuật DPCM (differential pulse code modulation) đã được CCITT chuẩn hoá theo tiêu chuẩn H.120. Các phương pháp nén dùng DPCM dựa trên nguyên tắc phát hiện sự giống nhau và khác nhau giữa các điểm ảnh (pixels) gần nhau để tìm cách loại bỏ các thông tin thừa. Tuy nhiên, chất lượng ảnh động không đạt được các yêu cầu cần thiết. Để cải thiện chất lượng ảnh động mà không làm tăng số lượng bộ so' với yêu cầu, kỹ
  43. thuật mã hoá chuyển sang dùng các phép biến đổi mà chúng có thể xử lý đồng thời một nhóm các pixels và ta có khái niệm về các bộ mã hoá trên các khối (block-based codecs). Đối với các bộ mã hoá trên các khối ảnh, mỗi điểm ảnh (pixel) sẽ cần ít hơn 1 bit để mã hoá. Các bộ mã hoá khối có thể dựa trên hai nguyên tắc biến đổi cơ bản: Discrete Cosine Transform (DCT) và Vector Quantization (VQ). DCT được dùng để biến đổi các khối ảnh hai chiều có kích thước 8X8 từ miền không gian sang miền tần số. Biến đổi DCT là tương tự như biến đổi DFT (Discrete Fourier Trransfonn). Các hệ số DCT nhận được sẽ được lượng tử hoá (Quantization) và mã hoá (Encode). Các hệ số DCT nhận được sẽ được lượng tử hoá (Quantisation coding) thành tập các hệ số đơn giản hơn nữa. Mục đích của nó là làm giảm hơn nữa số bit đặc trưng cho một hệ số. Tại bộ mã hoá sẽ có một bảng mã ( code book) và bảng các chỉ số nội bộ, từ đó có thể chọn được các từ mã ( code word) tương ứng một cách tốt nhất cho tập các hệ số được tạo ra. Quá trình lượng tử hoá cũng đồng thời làm tròn giá trị của các hệ số ở mức nhỏ hơn, đây chính là nguyên nhân gây ra mất tín hiệu, tuy vậy ảnh được khôi phục đạt chất lượng ở mức độ có thể chấp nhận được đối với người xem. Trong phương pháp VQ, bức ảnh được chia thành các khối có kích thước cố định, một bảng mã ( code book) được xây dựng với các chỉ số tương ứng với các khối ảnh này. Như vậy, thay cho việc phải truyền lần lượt các khối của bức ảnh, ta chỉ cần truyền các chỉ số tương ứng của các khối ảnh hoặc chỉ số tương ứng gần đúng nhất so với các khối ảnh cần truyền. Hai phương pháp này cho kết quả không khác nhau nhiều về chất lượng nén ảnh động, tuy nhiên ngày nay biến đổi DCT tỏ ra được ứng dụng rộng rãi hơn trong các sơ đồ nén và giải nén các bức ảnh ảnh (theo tiêu chuẩn JPEG) và xử lý ảnh động (theo tiêu chuẩn của MPEG). 4.3.2.1. Nén tín hiệu ảnh dùng MPEG MPEG (Moving Picture Expert Group) được ra đời vào năm 1988 nhằm mục đích chuẩn hoá cho nén tín hiệu âm thanh và video. MPEG - 1 có thể nén tín hiệu video tới 1. 5Mbit/s với chất lượng VHS và âm thanh lập thể (stereo audio) với tốc độ 1 ọ2 bit/s. Nó được dùng để lưu trữ video và âm thanh trên CD-ROM. Vào những năm 1990, MPEG-2 đã ra đời nhằm đáp ứng các tiêu chuẩn nén video cho truyền hình. MPEG-2 có khả năng mã hoá tín hiệu truyền hình ở tốc độ 3-l5Mbit/s và truyền hình độ nét cao ở tốc độ tới l5-30Mbit/s. MPEG-2 cho phép mã hoá tín hiệu video với nhiều mức độ phân giải khác nhau, chúng có khả năng đáp ứng cho nhiều ứng dụng khác nhau. Nhiều thuật toán tương ứng với nhiều các ứng dụng khác nhau đã phát triển và được tập hợp lại thành một bộ tiêu chuẩn đầy đủ của MPEG. Việc áp dụng toàn bộ các đặc điểm của chuẩn MPEG-2 trong tất cả các bộ mã hoá và giải mã là không cần thiết do sự phức tạp của thiết bị cũng như sự tốn kém về dải thông của đường truyền Vì vậy trong hầu hết các trường hợp ta chỉ sử dụng một phần nhất định trong toàn bộ các đặc điểm của chuẩn MPEG-2, chúng thường được gọi là profiles và levels. Một profile sẽ xác định một thuật toán (điều chỉnh bitstream và độ phân giải màu) và một level sẽ xác định một số tiêu chí bắt buộc cho các tham số của bức ảnh (ví dụ như kích thước ảnh và số lượng bit ). MPEG-4 trở thành một tiêu chuẩn cho nén ảnh kỹ thuật truyền hình số, các ứng dụng về đồ hoạ và video tương tác hai chiều (games, videoconferencing) và các ứng dụng multimedia
  44. tương tác hai chiều (World Wide Web hoặc các ứng dụng nhằm phân phát dữ liệu video như truyền hình cáp, Internet video ) vào năm 1999. Ngày nay, MPEG-4 đã trở thành một tiêu chuẩn công nghệ trong quá trình sản xuất, phân phối và truy cập vào các hệ thống video. Nó đã góp phần giải quyết vấn đề về dung lượng cho các thiết bị lưu trữ, giải quyết vấn đề về băng thông của đường truyền tín hiệu video hoặc kết hợp cả hai vấn đề trên. MPEG không phải là một công cụ nén đơn lẻ mà ưu điểm của nén ảnh dùng MPEG chính là ở chỗ MPEG có một tập hợp các công cụ mã hoá chuẩn, chúng có thể được kết hợp với nhau một cách linh động để phục vụ cho một loạt các ứng dụng khác nhau. Nén MPEG là sự kết hợp hài hoà của bốn kỹ thuật cơ bản: Tiền xử lý (Preprocessing), đoán trước sự chuyển động của các frame ở bộ mã hoá (temporal prediction), bù chuyển động ở bộ giải mã (motion compensation) và mã lượng tử hoá (quatisation coding). Các bộ lọc tiền xử lý sẽ lọc ra những thông tin không cần thiết từ tín hiệu video và những thông tin khó mã hoá nhưng không quan trọng cho sự cảm thụ của mắt người. Kỹ thuật đoán chuyển động dựa trên nguyên tắc là các ảnh trong chuỗi video dường như có liên quan mật thiết với nhau theo thời gian: Mỗi frame tại một thời điểm nhất định sẽ có nhiều khả năng giống với các frame đứng ngay phía trước và ngay phía sau nó. Các bộ mã hoá sẽ tiến hành quét lần lượt từng phần nhỏ trong mỗi frame gọi là macro blocks, sau đó nó sẽ phát hiện macro block nào không thay đổi từ frame này tôi frame khác. Bộ mã hoá sẽ tiên đoán trước sự xuất hiện của các macro blocks khi biết vị trí và hướng chuyển động của nó. Do đó chỉ những sự thay đổi giữa các khối trong frame hiện tại (motion compesated residual) và các khối được tiên đoán mới được truyền tới bên phía thu. Phía bên thu tức bộ giải mã đã lưu trữ sẵn những thông tin mà không thay đổi từ frame này tới frame khác trong bộ nhớ đệm của nó và chúng được dùng để điền thêm một cách đều đặn vào các vị trí trống trong ảnh được khôi phục. Như chúng ta đều biết, nén tín hiệu video được thực hiện nhờ việc loại bỏ cả sự dư thừa về không gian (spatial coding) và thời gian (temporal coding). Trong MPEG, việc loại bỏ dư thừa về thời gian (nén liên ảnh) được thực hiện trước hết nhờ sử dụng các tính chất giống nhau giữa các ảnh liên tiếp (lnter-frame techniques). Chúng ta có thể sử dụng tính chất này để tạo ra các bức ảnh mới nhờ vào những thông tin từ những ảnh đã gửi trước nó ("predicted"). Do vậy ở phía bộ mã hoá, ta chỉ cần gửi những bức ảnh có thay đổi so với những ảnh trước, sau đó ta lại dùng phương pháp nén về không gian để loại bỏ sự dư thừa về không gian trong chính bức ảnh sai khác này. Nén về không gian dựa trên nguyên tắc là phát hiện sự giống nhau của các điểm ảnh (pixels) lân cận nhau (Intra-frame coding techniques). JPEG chỉ áp dụng phương pháp nén theo không gian vì nó được thiết kế để xử lý và truyền các ảnh tĩnh. Tuy nhiên nén tín hiệu theo phương pháp của JPEG cũng có thể được dùng để nén các bức ảnh một cách độc lập trong dãy tín hiệu video. ứng dụng này thường được gọi là JPEG động (Motion JPEG). Trong một chu kỳ gửi một dãy các bức ảnh theo kiểu JPEG động, ảnh đầu tiên được nén nhờ sự loại bỏ độ dư thừa về không gian, sau đó các ảnh tiếp theo được nén nhờ sự loại bỏ độ dư thừa về thời gian (nén liên ảnh). Quá trình được lặp đi lặp lại cho một dãy các bức ảnh trong tín hiệu video. Thuật toán nén MPEG cũng dựa trên phép biến đổi DCT cho các khối ảnh 8x8 picxels để tìm ra sự thừa về không gian một cách có hiệu quả giữa các điểm ảnh trong cùng một bức ảnh. Tuy nhiên, trong trường hợp có mối tương quan chặt chẽ giữa các điểm ảnh trong các bức ảnh kế tiếp nhau tức là trong trường hợp hai bức ảnh liên tiếp có nội dung trùng nhau, kỹ
  45. thuật lnter- frame coding techniques sẽ được dùng cùng với việc tiên đoán sự dư thừa về không gian để tạo thành kỹ thuật tiên đoán bù chuyển động giữa các bức ảnh (Motion compesated prediction between frames). Trong nhiều sơ đồ nén MPEG, người ta thường kết hợp cả việc tiên đoán bù chuyển động theo thời gian và phép biến đổi thông tin theo không gian để đạt hiệu quả nén cao (Hybrid DPCM/DCT coding of video). Hầu hết các sơ đồ nén MPEG đều dùng kỹ thuật lấy mẫu bổ xung (Subsampling) và lượng tử hoá (Quantization) trước khi mã hoá. Lấy mẫu bổ xung nhằm mục đích để làm giảm kích thước bức ảnh đầu vào theo cả theo chiều ngang và chiều dọc, như vậy sẽ giảm số lượng các điểm ảnh trước mã hoá. Cũng nên nhớ rằng trong một số trường hợp người ta còn lấy mẫu bổ xung theo thời gian để làm giảm số lượng các bức ảnh trong dãy ảnh trước khi mã hoá. Đây được xem như là một kỹ thuật rất cơ bản nhằm loại bỏ sự dư thừa dựa vào khả năng lưu ảnh của mắt người cảm thụ. Thường thường, chúng ta có thể phân biệt sự thay đổi về độ sáng của ảnh (changes in Brightness) tốt hơn so với sự thay đổi về màu (Chromaticity changes). Do đó trước hết các sơ đồ nén MPEG sẽ tiến hành chia bức ảnh thành các thành phần Y (Luminance hay brightness plane) và UY (Chrominance hay color planes) tức là một thành phần về độ sáng và hai thành phần về độ màu. Các tín hiệu video thành phần này sẽ được lấy mẫu (samples) và số hoá (digitised) để tạo nên các điểm ảnh rời rạc theo tỷ lệ 4 : 2 : 2 và 4 : 2 : 0. Kỹ thuật tiên đoán bù chuyển động được sử dụng như là một trong những công cụ mạnh để làm giảm sự dư thừa về không gian giữa các bức ảnh. Khái niệm về bù chuyển động là dựa trên sự phán đoán hướng chuyển động của các bức ảnh tức là các ảnh thành phần trong dãy video sẽ được thay thế gần đúng. Kỹ thuật tiên đoán bù chuyển động giữa các bức ảnh được xem như là biện pháp để hạn chế bớt các thông số của chuyển động bởi việc dùng các vector chuyển động để mô tả sự dịch chuyển của các điểm ảnh. Kết quả tiên đoán tốt nhất của một điểm ảnh là dựa trên sự tiên đoán bù chuyển động từ một bức ảnh đã mã hoá được truyền phía trước của nó. Cả hai thông số, sai số chuyển động (biên độ) và các vectors chuyển động (hướng chuyển động) đều được truyền tới phía bên nhận. Tuy nhiên do có mối quan hệ tương quan chặt chê giữa các điểm ảnh về không gian (trùng về không gian), một vector chuyển động có thể được dùng cho một khối các điểm ảnh gồm các pixels lân cận nhau (MPEG -1 và MPEG -2 dùng các khối 16 x 1 6 pixels). Trong MPEG-2, có nhiều phương pháp để tiên đoán sự chuyển động. Ví dụ một khối ảnh có thể được tiên đoán xuôi từ những ảnh đã được truyền trước nó (Forward Predicted) có thể đoán ngược từ những ảnh truyền sau nó (Backward Predicted) hoặc theo cả hai chiều (Bidirectionally Predicted). Các phương pháp dùng để tiên đoán các khối trong cùng một ảnh cũng có thể không giống nhau, chúng có thể thay đổi từ khối nọ sang khối kia. Hơn nữa, hai trường (fields) trong cùng một khối cũng có thể được tiên đoán theo hai cách khác nhau dùng các vector độc lập nhau hoặc chúng có thể dùng chung một vector. Đối với mỗi khối ảnh, bộ mã hoá sẽ chọn các phương pháp tiên đoán thích hợp, cố gắng đảm bảo chất lượng ảnh tốt nhất khi được giải mã trong điều kiện yêu cầu khắt khe về số bit. Các thông số liên quan tới chọn phương pháp tiên đoán cũng được truyền tới bộ giải mã cùng với dự đoán sai số nhằm khôi phục gần chính xác ảnh gốc. Trong MPEG, có 3 kiểu ảnh khác nhau được dùng để mã hoá cho các khối ảnh. Kiểu ảnh 'Intra' (I-pictures) là ảnh được mã hoá một cách độc lập mà không cần tham khảo tới các
  46. ảnh khác. Hiệu quả nén tín hiệu đạt được do loại bỏ sự thừa về không gian mà không có yếu tố thời gian tham gia vào quá trình. I-pictures được dùng một cách tuần hoàn để tạo thành các điểm tựa cho dòng dữ liệu trong quá trình giải mã. ảnh 'Predictive' (P-pictures) có thể sử dụng các ảnh I hoặc P ngay sát phía trước nó để bù chuyển động và chính nó cũng có thể được dùng để tham khảo cho việc tiên đoán các ảnh khác tiếp theo. Mỗi khối ảnh trong P-picture có thể hoặc được mã theo kiểu tiên đoán (predicted) hoặc được mã một cách độc lập (intra-coded). Do sử dụng cả nén theo không gian và thời gian, hiệu quả nén của P-pictures được tăng lên một cách đáng kể so với I-pictures. Ảnh 'Bidirectionally-predictive' pictures hay B- Pictures có thể sử dụng các ảnh I hoặc P phía trước hoặc phía sau nó cho việc bù chuyển động và do vậy cho kết quả nén cao nhất. Mỗi khối trong B-pictures có thể được tiên đoán theo chiều ngược, xuôi, cả hai hướng hoặc được mã một cách độc lập. Để có thể tiên đoán ngược từ một bức ảnh phía sau nó, bộ mã hoá sẽ tiến hành sắp xếp lại các bức ảnh từ thứ tự xuất hiện một cách tự nhiên sang một thứ tự khác của các ảnh trên đường truyền. Do vậy từ đầu ra của bộ mã hoá, B-pictures được truyền sau các ảnh dùng để tham khảo ở phía trước và phía sau của nó. Điều này sẽ tạo ra độ trễ do phải sắp xếp lại thông tin( độ trễ này lớn hay nhỏ là tuỳ thuộc vào số các bức ảnh B-pictures liên tiếp nhau được truyền. CáC ảnh I P. B-pictures thường xuất hiện theo một thứ tự lặp đi lặp lại một cách tuần hoàn, do đó ta có khái niệm về nhóm các bức ảnh GOP (Group of Pictures). Một ví dụ của GOP ở dạng ảnh tự nhiên xuất hiện theo thứ tự như sau: BlB B2B I3 B4 B5 B7 B8 P9 B10 B11 P12 Thứ tự xuất hiện của chúng trên đường truyền bị thay đổi do sự sắp xếp lại của bộ mã hoá như sau: I3 B1 B2 P6 B4 B5 p9 B7 B8 P12 B10 B11 Cấu trúc của một GOP có thể được mô tả bởi hai tham số: N là số các ảnh trong GOP và M là khoảng cách giữa các ảnh P-pictures. Nhóm GOP này được miêu tả như N = 12 và M = 3.4.3.2.2. Sơ đồ của bộ mã hoá và giải mã dùng MPEG-2 Sơ đồ bộ mã hoá và giải mã MPEG 2 được trình bày trên hình 4.3. a. Mã hoá MPEG-2 Quá trình mã hoá cho P pictures và B pictures được giải thích như sau: Dữ liệu từ các khối ảnh (macroblocks) cần được mã hoá sẽ được đưa đến cả bộ trừ (Subtractor) và bộ đoán chuyển động (Motion Estimator). Bộ đoán chuyển động sẽ so sánh các khối ảnh mới được đưa vào này với các khối ảnh đã được đưa vào trước đó và được lưu lại như là các ảnh dùng để tham khảo (Reference Picture). Kết quả là bộ đoán chuyển động sẽ tìm ra các khối ảnh trong ảnh tham khảo gần giống nhất với khối ảnh mới này. Bộ đoán chuyên động sau đó sẽ tính toán vector chuyển động (Motion Vector), vector này sẽ đặc trưng cho sự dịch chuyển theo cả hai chiều dọc và ngang của khối ảnh mới cần mã hoá so với ảnh tham khảo. Chúng ta lưu ý rằng vector chuyển động có độ phân giải bằng một nửa do thực hiện quét xen kẽ. Bộ đoán chuyển động cũng đồng thời gửi các khối ảnh tham khảo này mà chúng thường được gọi là các khối tiên đoán (Predicted macroblock) tới bộ trừ để trừ với khối ảnh mới cần mã hoá (thực hiện trừ từng điểm ảnh tương ứng tức là Pixel hy pixel). Kết quả là ta sẽ được