Bài giảng Truyền thông đa phương tiện - Trần Quang Đức
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Truyền thông đa phương tiện - Trần Quang Đức", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
- bai_giang_truyen_thong_da_phuong_tien_tran_quang_duc.pdf
Nội dung text: Bài giảng Truyền thông đa phương tiện - Trần Quang Đức
- TRUYỀN THÔNG ĐA PHƯƠNG TIỆN Trần Quang Đức
- Thông tin Giảng Viên • Thông tin liên hệ ▫ Phòng B1-801 (10 am - 11 am – Thứ Ba Hàng Tuần) ▫ Bộ môn Truyền Thông và Mạng Máy Tính ▫ Viện Công Nghệ Thông Tin và Truyền Thông ▫ Đại học Bách Khoa Hà Nội ▫ E-mail: ductq@soict.hust.edu.vn ▫ Điện thoại: (+84) (4) 38682596 • Thông tin bên lề ▫ Tiến sĩ chuyên ngành Kỹ Thuật Thông Tin, 2014 ▫ Thạc sĩ chuyên ngành Điện Tử Viễn Thông, 2008
- Mục tiêu Môn học • Trình bày cơ sở lý thuyết và hoạt động của các công nghệ xử lý đa phương tiện. • Giới thiệu về truyền thông đa phương tiện và các ứng dụng cơ bản của truyền thông đa phương tiện. • Nghiên cứu về các kiểu dữ liệu đa phương tiện (văn bản, hình ảnh, âm thanh, audio và video) và các ứng dụng (VoIP, Truyền hình theo yêu cầu (VoD), thư điện tử đa phương tiện, truyền hình tương tác, v.v )
- Cấu trúc Môn học • Chương 1: Giới thiệu chung • Chương 2: Xử lý dữ liệu đa phương tiện • Chương 3: Hệ thống truyền thông đa phương tiện • Chương 4: Ứng dụng đa phương tiện
- Tài liệu tham khảo 1. Jens-Rainer Ohm, “Multimedia Communication Technology”, Springer-Verlag Berlin 2014. 2. William Stallings, “Data and Computer Communication”, Prentice Hall – New Jersey 2007 3. J.D. Gibson, Editor, “Multimedia Communication”, Academic Press, San Diego, CA, USA, 2001. 4. L.L Ball, “Multimedia Network Integration and Management”, McGraw-Hill, 1996.
- Tài liệu tham khảo 5. S.J. Gibbs, and D. C. Tsichritzis, “Multimedia Programming”, Addison-Wesley, New York, 1995. 6. W. Kou, “Digital Image Compression”, Kluwer publishers, London 1995. 7. S.J. Solari, “Digital Video and Audio Compression”, McGraw-Hill, 1997.
- No Pain, No Gain • Đề cương 60 câu hỏi ▫ Bao quát tất cả các vấn đề về truyền thông đa phương tiện • Bài tập ▫ Không nằm trong 60 câu hỏi ▫ Được trình bày trong bài giảng ▫ Đề thi gồm ≥ 7 câu hỏi ▫ Không dùng tài liệu ▫ Bao quát tất cả chương
- GIỚI THIỆU CHUNG Trần Quang Đức
- Định nghĩa • Dữ liệu đa phương tiện: ▫ Dữ liệu đa phương tiện = Tổng hợp của nhiều kiểu dữ liệu (văn bản, âm thanh, audio, video và hình ảnh). • Truyền thông đa phương tiện là sự kết hợp của hai công nghệ: Xử lý dữ liệu đa phương tiện và Mạng truyền thông. • Ứng dụng: Hội nghị truyền hình, đào tạo từ xa e- learning, giải trí, và giám sát từ xa v.v
- Dữ liệu và Tín hiệu • Để truyền đi, dữ liệu phải chuyển sang tín hiệu. Tín hiệu có dạng sóng điện từ lan truyền trong những môi trường khác nhau, tùy thuộc vào phổ tín hiệu. • Dữ liệu có thể là tương tự hoặc số. Dữ liệu tương tự lấy giá trị liên tục trong một khoảng thời gian (ví dụ: âm thanh và video). Dữ liệu số lấy giá trị rời rạc (ví dụ: văn bản hoặc số tự nhiên). • Tín hiệu có thể là tương tự hoặc số. Tín hiệu tương tự có giá trị thay đổi liên tục theo thời gian. Tín hiệu số được xác định trên một tập rời rạc theo thời gian.
- Tín hiệu tuần hoàn và không tuần hoàn • Một tín hiệu x(t) được gọi là tuần hoàn nếu tốn tại một hằng số T0 sao cho x(t)=x(t+T0). • Tín hiệu không tuần hoàn luôn thay đổi không có tập giá trị hay chu kỳ nào được được lập lại theo thời gian. • Trong truyền thông, người ta thường sử dụng tín hiệu tương tự tuần hoàn và tín hiệu số không tuần hoàn.
- Dữ liệu Đa phương tiện • Văn bản: Tập hợp của các ký tự, mỗi ký tự được biểu diễn bởi một số lượng bit nhất định, được gọi là từ mã. • Ảnh tĩnh: Tập hợp của các điểm ảnh trong không gian hai chiều. Mỗi điểm ảnh được biểu diễn bằng một số lượng bit nhất định. • Âm thanh và Video: Một dạng dữ liệu tương tự có giá trị thay đổi theo thời gian (ví dụ, nói chuyện điện thoại có thể diễn ra trong vài phút, trong khi một bộ phim có thể kéo dài hàng giờ. • Animation: Tập hợp của ảnh đồ họa.
- Phân loại dữ liệu Đa Phương Tiện • Dữ liệu tự nhiên và nhân tạo ▫ Dữ liệu tự nhiên (natural): được thu nhận trực tiếp từ thế giới thực (ví dụ?). ▫ Dữ liệu nhân tạo (artificial): thông tin được tạo ra từ máy tính (ví dụ?). • Dữ liệu rời rạc và liên tục ▫ Dữ liệu rời rạc: chỉ bao gồm các chiều về không gian (ví dụ?). ▫ Dữ liệu liên tục: Bao gồm các chiều về cả thời gian và không gian (ví dụ?)
- Phân loại dữ liệu Đa Phương Tiện Âm thanh Video Animation Liên tục Liên tục Ảnh tĩnh Văn bản Đồ họa Rời rạc Rời rạc Thu nhận từ thế giới thực Tạo ra bởi máy tính
- Văn bản • Văn bản thô (Plain text) ▫ Không định dạng ▫ Ký tự ở dạng nhị phân ▫ Sử dụng mã ASCII ▫ Tất cả các ký tự có cùng kiểu và kiểu chữ • Rich text (RTF) ▫ Có định dạng ▫ Lưu thông tin định dạng bên cạnh từ mã của ký tự ▫ Nhiều chuẩn khác nhau ▫ Ký tự có nhiều kích cỡ, hình dạng và kiểu dáng
- Mã hóa và Nén Văn Bản • Mã hóa văn bản ▫ ASCII Chuẩn truyền thống (7 bit – 128 ký tự) Chuẩn mở rộng (8 bit – 256 ký tự) ▫ Unicode Hệ thống 16 bit (65,536 ký tự) > 110,187 ký tự đồ họa và điều khiển • Nén văn bản ▫ Phương pháp thống kê: Mã Huffman ▫ Phương pháp từ điền: Lempel-Ziv ▫ Tỷ lệ nén: 1/2 - 2/3 kích thước văn bản
- Đồ Họa • Văn bản có thể chỉnh sửa, chứa các thông tin cấu trúc như đường thẳng, hình tròn v.v • Thường được tạo ra bởi các chương trình máy tính như Corel Draw, Adobe Illustrator The image cannot be displayed. Your computer may not have enough memory to open the image, or the image may have been corrupted. Restart your computer, and then open the file again. If the red x still appears, you may have to delete the image and then insert it again.
- Ảnh Tĩnh • Tập hợp các điểm ảnh trong không gian 2 chiều ▫ Điểm ảnh: phần tử nhỏ nhất biểu diễn ảnh ▫ Điểm ảnh được biểu diễn bởi một số lượng bit nhất định ▫ Pixel depth: số lượng bit biểu diễn một điểm ảnh • Không chứa thông tin cấu trúc • Ảnh đưa vào máy tính bằng máy quét (scanner) Computer Synthesized Software image Capture and A/D Camera Scanned image conversion
- Ảnh Tĩnh (Tiếp) • Ví dụ về ảnh tĩnh ▫ Ảnh nhị phân: pixel depth 1 ▫ Ảnh đa mức xám: pixel depth 8 ▫ Ảnh màu: pixel depth 24 Điểm ảnh (RGB)
- Đồ Họa và Ảnh Tĩnh • Đồ họa ▫ Có thể chỉnh sửa, thay đổi ▫ Chứa các thông tin cấu trúc ▫ Nội dung ngữ nghĩa được bảo toàn lúc trình chiếu ▫ Miêu tả bằng các đối tượng • Ảnh tĩnh ▫ Không thể chỉnh sửa, thay đổi ▫ Không ý thức được các thông tin cấu trúc ▫ Nội dung ngữ nghĩa không được bảo toàn lúc trình chiếu ▫ Miêu tả bằng các điểm ảnh
- Nén Ảnh • Nén không mất mát thông tin ▫ Mã loạt dài (RLC) ▫ Mã từ điền Lempel-Ziv ▫ GIF, BMP, TIFF • Nén mất mát thông tin ▫ Nén dựa trên các biến đổi không gian (Transform coding) ▫ Giảm mẫu kênh màu (Chroma sub-sampling) ▫ JPEG, JPEG2000
- Video • Video – Chuỗi ảnh ▫ Tự nhiên hoặc nhân tạo ▫ Tập hợp của các ảnh tĩnh • Tỷ lệ khung hình (Frame rate) ▫ NTSC (Mỹ, Nhật Bản): 30 khung hình/s ▫ PAL (Châu Âu): 25 frames/s ▫ SECAM (Pháp): 24 khung hình/s ▫ HDTV: 50/60 khung hình/s ▫ UHDTV: 120 khung hình/s
- Video và Animation • Cả hai đều là chuỗi các ảnh tĩnh hoặc đồ họa được trình chiếu trong một khoảng thời gian để tạo ra cảm giác chuyển động. • Video – Chuỗi ảnh ▫ Tự nhiên hoặc nhân tạo ▫ Chuỗi các ảnh tĩnh • Animation – Chuỗi ảnh đồ họa ▫ Tạo ra bằng máy tính ▫ Lưu tập hợp của các đối tượng ▫ Chuyển động của các đối tượng dựa trên tính toán
- Nén Video • International Telecommunication Union (ITU-T) ▫ H.261: ISDN Video Phone (px64 kb/s) ▫ H. 263: PSTN Video Phone (<64 kb/s) ▫ H.26L: Nhiều ứng dụng khác nhau (<64 kb/s) Truyền hình theo yêu cầu, Video Mail • International Organization for Standard (ISO) ▫ MPEG-1 Video: CD-ROM (1.2 Mb/s) ▫ MPEG-2 Video: SDTV, HDTV (4-80 Mb/s) ▫ MPEG-4 Video: Nhiều ứng dụng khác nhau (24-1024 kb/s)
- Âm thanh • Âm thanh (âm thanh thoại, âm nhạc, tiếng ồn) ▫ Tín hiệu tương tự một chiều biến thiên theo thời gian ▫ Được lan truyền dựa trên áp suất và tương tác giữa các phân tử trong môi trường truyền dẫn. • Sóng âm thanh: Có dạng hình sin với các đặc trưng ▫ Tần số ▫ Bước sóng ▫ Biên độ • Tai người: 20-20,000 Hz. Giới hạn trên giảm dần theo tuổi tác.
- Âm thanh số • Tín hiệu âm thanh được chuyển sang dạng số ▫ Lấy mẫu ▫ Lượng tử hóa • Tần số lấy mẫu ▫ Âm thanh thoại: 8 kHz ▫ CD-audio: 44.1 kHz • Lượng tử hóa ▫ Âm thanh thoại: 8 bit ▫ CD-audio: 16 bit • Nén audio ▫ Nén không mất mát thông tin: FLAC, Apple Lossless ▫ Nén mất mát thông tin: MP3 (Tỷ lệ nén: 50-60%)
- Mô hình Truyền dữ liệu đơn giản Transmission Source Transmitter Receiver Destination System • Thiết bị nguồn tạo ra dữ liệu cần truyền (ví dụ?) • Thiết bị truyền chuyển đổi và mã hóa dữ liệu thánh sóng điện từ để truyền đi trong môi trường truyền dẫn. • Hệ thống truyền dẫn có thể là đường truyền hoặc mạng máy tính để kết nối giữa thiết bị nguồn và đích. • Thiết bị nhận chuyển đổi tín hiệu điện từ thành dạng dữ liệu có nghĩa với thiết bị đích. • Thiết bị đích nhận dữ liệu từ thiết bị nhận.
- Nhiệm vụ của Truyền Thông Tận dụng hệ thống truyền thông Điều khiển dòng Tạo ra giao tiếp, kết nối Đánh địa chỉ Tạo ra tín hiệu Định tuyến Đồng bộ hóa Khôi phục trạng thái Quản lý trao đổi thông tin An toàn an ninh mạng Xác định và sửa lỗi Quản lý mạng máy tính
- Hệ phân tán Đa phương tiện • Hệ phân tán đa phương tiện bao gồm truyền và phân tán dữ liệu đa phương tiện trên mạng máy tính • Máy chủ đa phương tiện ▫ Silicon Graphic ▫ HP Media Server • Mạng đa phương tiện ▫ PSTN/Data Network etc. • Máy khách đa phương tiện
- Hệ phân tán Đa phương tiện (Tiếp) • Hệ thống truyền thông thời gian thực ▫ Thu nhận, nén và truyền trực tiếp dữ liệu đa phương tiện (ví dụ?) • Hệ thống truyền dữ liệu đã được lưu trữ ▫ Dữ liệu được nén và lưu ở máy chủ. Hệ thống truyền dữ liệu này đến một hoặc nhiều thiết bị nhận (ví dụ?) • Khác biệt giữa hai hệ thống ▫ Thu nhận dữ liệu: Thời gian thực so với thu nhận từ trước. ▫ Nén dữ liệu: Nén thời gian thực/nén ngoại tuyến?, nén có thể hiệu chỉnh trong quá trình truyền?
- Hệ phân tán Đa phương tiện (Tiếp) • Yêu cầu với những ứng dụng đa phương tiện trên mạng ▫ Yêu cầu về độ trễ ▫ Yêu cầu về chất lượng Yêu cầu về trình chiếu Yêu cầu về đồng bộ dữ liệu Yêu cầu về tính liên tục Phù hợp trong điều kiện mất mát thông tin • Vấn đề với mạng dữ liệu đa phương tiện ▫ Bật cập giữa kích thước dữ liệu và băng thông ▫ Bất cập giữa nhu cầu của người dùng và khả năng đáp ứng của mạng. ▫ Bất cập giữa nhu cầu của các người dùng khác nhau
- Máy chủ Đa phương tiện • Máy chủ đa phương tiện Tape storage CPU ▫ Lưu trữ dữ liệu Tape ▫ Đồng bộ dữ liệu Controller ▫ Nén âm thanh/video System bus • Yêu cầu ▫ Hiệu năng cao Network Disk Network ▫ Ổn định Controller adapter High-speed bus MPEG-1: 1-2 Mb/s Disk on-line MPEG-2: 2-40 Mb/ storage s
- Thiết bị Đa phương tiện • Thiết bị số: ▫ Máy tính ▫ Thiết bị số hóa cho audio và video. • Thiết bị tương tự: ▫ Máy quay phim ▫ Micro, Loa ▫ Máy nghe nhạc • Thiết bị đồng bộ: ▫ Hỗ trợ đồng bộ về thời gian • Thiết bị tương tác: ▫ Chuột, bàn phím v.v
- Mạng truyền thông Đa phương tiện • Mạng thoại: ▫ Public switched telephone networks (PSTNs): Được thiết kế chủ yếu cho các dịch vụ thoại, nhưng được mở rộng cho các ứng dụng đa phương tiện với chất lượng thấp • Mạng dữ liệu: ▫ Được thiết kế cho những dịch vụ truyền dữ liệu đơn giản (e-mail/ftp), nhưng có thể dùng cho các ứng dụng đa phương tiện. • Mạng truyền hình: ▫ Truyền hình • Mạng đa dịch vụ chất lượng cao ▫ Nhiều dịch vụ khác nhau.
- Hệ điều hành Đa phương tiện • Hệ điều hành đa phương tiện cung cấp môi trường cho việc chạy các ứng dụng và tận dụng tài nguyên của mày tính và mạng. Multimedia Applications Multimedia I/O Stream Multimedia Device Manager Handlers Manager Physical Device Stream and Multimedia I/O Drive Driver Synchronization manager Audio/ video codec Hard Optical CD Analog video Analo disc drive ROM NTSC, PAL g drive drive audio Monitor PCM
- Hệ điều hành Đa phương tiện (Tiếp) • Các yêu cầu: ▫ Soft real-time application: đảm bảo dựa trên thống kê ▫ Interactive application: không cần đảm bảo tuyệt đối nhưng yêu cầu về thời gian đáp ứng ▫ Throughput-intensive application: không yêu cầu về hiệu năng nhưng yêu cầu về thông lượng truyền. ▫ Fair, Proportionate resource allocation: Chia sẻ tài nguyên giữa các ứng dụng ▫ Application Isolation: Ngăn chặn ảnh ưởng của ứng dụng lỗi đến các ứng dụng khác (máy chủ truyền dòng thời gian thực không được ảnh hưởng đến máy chủ phục vụ web).
- Hệ điều hành Đa phương tiện (Tiếp) Root Root I TP SRT Class-specific Schedulers I SRT TP Http SRT 33% 33% 33% 33% 66% Audio Video D1 D2 Audio Video C Class-Independent Scheduler 20% 80% 50% 50% 20% 80% FCFS CPU Scheduler Packet Scheduler Disk Scheduler
- Ứng dụng Đa phương tiện • Multimedia Information Systems: Cơ sở dữ liệu đa phương tiện, Sách điện tử, Hệ thống chuyên gia, v.v • Multimedia Communication Systems: VOIP, Truyền thông audio và video, Computer-supported collaborative works, Hội nghị truyền hình, IPTV, Dịch vụ truyền dữ liệu đa phương tiện từ xa, v.v • Multimedia Entertainment Systems: Game, Game 3D, Thiết kế đa phương tiện, Multiplayer networks, Sản phẩm tương tác dựa trên audio và video, v.v
- Ứng dụng Đa phương tiện (Tiếp) • Multimedia Educational Systems: E-Books, E- learning, Flexible teaching materials, Simulation education systems, v.v • Multimedia Business Systems: Thương mại điện tử, Mua sắm dựa trên hiện thực ảo v.v
- Môi trường ứng dụng Đa phương tiện
- Ví dụ (Truyền hình theo yêu cầu) ADSL STB Media Server Authentication /Billing Server CATV STB Router Streaming Server Modem STB Web Server
- SỐ HÓA TÍN HIỆU Trần Quang Đức
- Tín hiệu tương tự • Biên độ của tín hiệu tương tự biến thiên liên tục theo thời gian • Biến đổi Fourier (Fourier transform - FT) chia tín hiệu thành những thành phần tần số. • Dựa trên FT, có thể chứng minh một tín hiệu biến thiên theo thời gian bất kỳ được cấu thành từ tập hợp vô hạn các sóng hính sin.
- Tín hiệu tương tự (Tiếp) • Tín hiệu x(t) được gọi là có dải giới hạn nếu như biến đổi Fourier của nó chỉ có giá trị trong một dải tần số nhất định. • Tồn tại một giá trị B dương sao cho X(f) chỉ khác 0 trong khoảng -B≤f≤B. B được gọi là băng tần của tín hiệu. • Băng tần của âm thanh thoại: 50Hz – 4kHz • Để truyền một tín hiệu tương tự, băng tần của đường truyền phải lớn hơn hoặc bằng băng tần của tín hiệu.
- Thiết bị Mã Hóa Analog Sample Digital AAF Quantizer Signal and Hold Codeword ADC • Thiết bị mã hóa gồm có bộ lọc khử răng cưa AAF (Anti- Aliasing Filter) and và thiết bị số hóa (ADC)
- Thiết bị Mã hóa (Tiếp) • Bộ lọc khử răng cưu AAF loại bỏ những thành phần tần số cao từ tín hiệu. • Sample and Hold lấy mẫu tín hiệu sau lọc và giữ giá trị của biên độ giữa các mẫu. • Quá trình lượng tử chuyển mẫu lấy được về dạng nhị phân.
- Biển diễn Dữ liệu • Bit có ý nghĩa nhất của từ mã biểu diễn dấu của giá trị của mẫu lấy được. • Mã nhị phân 0 thể hiện giá trị dương trong khi mã nhị phân 1 thể hiện giá trị âm. • Tín hiệu phải được lấy mẫu với tần số lớn hơn nhiều tần số lớn nhất của tín hiệu. • Số mức lượng tử phải đủ lớn để tìn hiệu được biểu diễn chính xác.
- Tần số lấy mẫu • Định lý Nyquist: Nếu x(t) là tín hiệu có dải tần giới hạn với tần số lớn nhất là B. Tấn số lấy mẫu (fs) phải lớn hơn hoặc bằng 2B. 2B được gọi là tỷ số Nyquist. • Tỷ số Nyquist có đơn vị là Hz hoặc chính xác hơn là số lượng mẫu trên giây
- Tần số lấy mẫu (Tiếp) • Nếu tần số lấy mẫu fs≥2B, những thành phần trong phổ của tín hiệu với dải tần giới hạn nằm tách biệt. Tuy nhiên nếu điều kiện Nyquist không được thỏa mãn, những thành phần trên bị xếp chồng lên nhau, tạo thành hiệu ứng răng cưa.
- Lượng Tử Hóa • Lượng tử hóa (Quantization) là quá trình biến đổi giá trị tương tự thành dạng nhị phân • Nếu mỗi mẫu được biểu diễn bằng 3 bit (1 bit cho dấu và hai bit cho giá trị biên độ) Nếu Vmax là giá trị biên độ lớn nhất và n là số bit được sử dụng cho quá trình lượng tử hóa thì khoảng lượng tử hóa quantization interval, q, được định nghĩa như sau: n q = Vmax/2
- Sai số lượng tử hóa • Sai số lượng tử hóa là sự sai khác giữa giá trị biên độ thực và giá trị quy đổi khi lượng tử hóa. Với lượng tử hóa đều, sự sai khác là ±q/2. Sai số lượng tử còn được gọi là nhiễu lượng tử bởi giá trị sai số thay đổi ngẫu nhiên SQNR = 6.02 x n (dB) SQNR = 1.761+ 6.02 x n (dB)
- Thiết bị Giải mã Digital Low-Pass Analog DAC Codeword Filter Signal • Thiết bị giải mã dùng để chuyển đổi dữ liệu số thành tín hiệu tương tự thông qua việc sử dụng thiết bị số hóa ngược và bộ lọc thông thấp.
- Zero-Order Hold • Zero-Order Hold miêu tả quá trình chuyển đổi dữ liệu rời tạc thành dữ liệu liên tục bằng cách giữ nguyên giá trị của mẫu một khoảng thời gian bằng khoảng thời gian lấy mẫu
- Văn Bản Trần Quang Đức
- Các dạng Văn bản • Văn bản không định dạng (ví dụ: plain text) cho phép tạo ra trang văn bản chỉ gồm những ký tự có kích thước cố định từ tập hợp hữu hạn của các ký tự. • Văn bản định dạng (ví dụ, rich text (RTF)) cho phép tạo ra trang văn bản là tập hợp của những ký tự với nhiều kiểu, kích thước và màu sắc khác nhau. • Siêu văn bản là tập hợp của các tài liệu có liên kết. Mỗi tài liệu là một văn bản định dạng.
- Bảng mã ASCII 33 ký tự điền khiển Back space, Delete, Escape 95 ký tự thường Chữ cái, Số, Dấu chấm A – 1000001 (65) • Bảng mã ASCII (American Standard Code for Information Interchange) là một trong những bảng mã thông dụng nhất. Mỗi một ký tự được mã hóa bằng 7 bit.
- ISO/IEC 8859 • ISO/IEC 8859 là chuẩn sử dụng 8 bit để mã hóa, bổ sung thêm 96 ký tự thường (Chữ cái Latin) • ISO/IEC 8859 được chia ra các phần như sau: ▫ Phần 1: Latin-1 Western European ▫ Phần 2: Latin-2 Central European ▫ ▫ Phần 16: Latin-10 South-Eastern European • Mặc dù tiếng Việt sử dụng chữ cái Latin, nhưng tiếng Việt yêu cầu bổ sung nhiều hơn 96 ký tự thường.
- Unicode • UTF và UCS ▫ Unicode Transformation Format (UTF) UTF-8: 8 bit, độ dài từ mã thay đổi và tương thích với ACSII UTF-16: 16 bit, độ dài từ mã thay đổi UTF-32: 32 bit, độ dài từ mã cố định ▫ Universal Character Set (UCS) UCS-2 là tập con của UTF-16 UCS-4 tương đương với UTF-32 • UTF-8 và UTF-16 là bảng mã được sử dụng rộng rãi nhất (XML, HTML, Microsoft đều khuyến nghị sử dụng UTF-8 or UCS-2/UTF-16 cho các ứng dụng)
- Nén Văn Bản • Nén không mất mát thông tin ▫ Phương pháp thống kê (ví dụ Mã Huffman) ▫ Phương pháp từ điển (ví dụ Lempel-Ziv) • Sử dụng để nén văn bản tự nhiên với ký tự hoặc chuỗi ký tự lặp tương tự. • Được dùng trong những chương trình nén dữ liệu như zip, bzip2, 7zip, v.v • Tỷ lệ nén: khoảng ½-2/3 kích thước văn bản
- Mã Huffman • Mã Huffman: Phương pháp nén dự trên mô hình thống kê xem xét sắc xuất phân bố của ký tự. Mô hình xác định sắc xuất có thể là mô hình tĩnh, thích nghi hoặc bán thích nghi (semi- adaptive). • Mô hình tĩnh được tích hợp sẵn trong thiết bị nén và thiết bị giải nén. • Mô hình bán thích nghi là mô hình cố định được xây dựng từ dữ liệu được nén. • Mô hình thích nghi thay đổi trong quá trình nén.
- Thuật toán cơ bản • Các ký tự có tần suất xuất hiện khác nhau. • Các ký tự chiếm không gian biểu diễn khác nhau. • Ký tự với độ dài từ mã nhị phân cố định trong bảng mã ASCII được thay bằng từ mã có độ dài thay đổi. • Từ mã ngắn được gán cho các ký tự với tần suất xuất hiện cao trong văn bản hoặc tập văn bản. • Bộ mã tạo ra có tính chất tiền tố.
- Thuật toán cơ bản (Tiếp) 1) Quét văn bản để thống kê tần suất xuất hiện của các ký tự. 2) Xây dựng cây mã Huffman dựa trên thống kê tần suất. Mỗi ký tự được biểu diễn bằng một nút lá. Nút lá xa gốc được gán cho ký tự ít xuất hiện. 3) Từ mã biểu diễn ký tự được lấy thông qua đường dẫn từ gốc đến nút lá tương ứng. Nhánh rẽ trái và nhánh rẽ phải được ký hiệu bởi bit 0 và 1.
- Minh họa • Xét chuỗi ký tự sau: BCAACADBDCADAEEEABACDBACADCBADABEABEAAA • A: 15; B: 7; C: 6; D: 6; E: 5 (39) Mã hóa 0 1 Text Compression for Web Developers ? A(15) (24) 0 1 (13) (11) 0 1 0 1 B(7) C(6) D(6) E(5)
- Mã từ điển Lempel-Ziv • Mã từ điển xây dựng từ mã mới cho một chuỗi các từ mã. • Ví dụ: Bảng mã ASCII – mỗi từ mã có độ dài 8 bit, cho phép mã hóa 256 ký tự. • Mã từ điển mở rộng thư viện với từ mã có độ dài từ 9 đến 12 bit. Từ mã mới là chuỗi các từ mã đã xuất hiện. • Mã từ điển hoạt động không hiệu quả với văn bản gồm những chuỗi ký tự ngắn và khác nhau.
- Minh họa • Xét chuổi ký tự sau: ABCBCABCABCD Previous Input Output Symbol Index Previous Input Output Symbol Index Input Input NIL A NIL A A A B A AB 256 A B B AB 256 B C B BC 257 B C C BC 257 C B C CB 258 C 257 BC CB 258 B C BC 256 AB BCA 259 BC A BC BCA 259 AB C C ABC 260 A B C 260 ABC CA 261 AB C AB ABC 260 ABC D D ABCD 262 C A C CA 261 A B AB C ABC D ABC ABCD 262 D EOL D
- ẢNH TĨNH Trần Quang Đức
- Định nghĩa • Tất cả các ảnh đều được biểu diễn bằng ma trận hai chiều của các điểm ảnh (pixel). Pixel (RGB)
- Mô hình màu • RGB (Red - Đỏ, Green - Lục, và Blue - Lam) – Sử dụng biểu diễn màu trong máy tính. RGBA là RGB với kênh alpha thể hiện tính trong suốt. • CMYK (Cyan – Lục lam, Magenta – Đỏ tươi, Yellow - Vàng, và Black - Đen) – Sử dụng trong in ảnh. • YCbCr – Sử dụng trong các hệ thống video. YUV thể hiện giá trị độ chói (Luminance) và sắc thái màu (Chrominance). • HSV – Sử dụng trong hội họa. HSV biểu diễn màu với độ chói (Value), sắc độ (Hue) và độ bão hòa (Saturation).
- Mô hình màu (Tiếp) HSV YCbCr (Y=0.5) RGB CMYK
- Mô hình màu (Tiếp) • YCbCr không thể hiện không gian màu tuyệt đối, nó là cách để mã hóa thông tin RGB. YCbCr chứa những thông tin liên quan đến cảm nhận màu sắc của mắt người. Y = 16+219(0.299R+0.587G+0.114B)/255 Cb = 128+224(-0.169R-0.331G+0.5B)/255 Cr = 128+224(0.5R-0.419G-0.081B)/255
- Nén Ảnh • Nén không mất mát thông tin ▫ Mã loạt dài (Run Length Coding) ▫ Mã Huffman (Huffman Coding) ▫ Mã từ điển Lempel-Ziv • Nén mất mát thông tin ▫ Mã hóa dựa trên biến đổi không gian (Transform Coding) ▫ Giảm mẫu kênh màu (Chroma sub-sampling) ▫ JPEG, JPEG2000
- Giảm mẫu kênh màu
- Giảm mẫu kênh màu (Tiếp) • 4:4:4 (1:1) ▫ Thiết bị quét phim cao cấp ▫ Điện ảnh • 4:2:2 (3:2) ▫ Đinh dạng video cao cấp • 4:1:1 (2:1) ▫ DVCPRO (ví dụ NTSC, PAL ) • 4:2:0 (2:1) ▫ MPEG, mã hóa video H.26X ▫ DVD, Blue-ray ▫ JPEG, MJPEG
- Chuẩn JPEG • JPEG là chuẩn nén ảnh, được phát triển bởi “Joint Photographic Experts Group”. • JPEG là định dạng thường được sử dụng trong lưu và truyền ảnh. • JPEG nén được trên cả ảnh màu và đen trắng • Tỷ lệ nén 1:10 nhưng không ảnh hưởng nhiều đến cảm nhận của mắt người.
- Chuẩn JPEG • JPEG là kỹ thuật nén mất mát thông tin dựa trên biến đổi 2D-DCT (Discrete Cosine Transform). ▫ Nhận định 1: Nội dung ảnh thay đổi tương đối chậm trên bề mặt của ảnh. ▫ Nhận định 2: Mắt người nhạy cảm hơi với những mất mát thuộc về thành phần tần số thấp. ▫ Nhận định 3: Mắt người cảm nhận tốt hơn sự thay đổi về độ chói so với màu sắc.
- Chuẩn JPEG 8×8 blocks Entropy Compressed Image FDCT Quantization Encoding Source Image Quant. Table Huffman Table 8×8 blocks Entropy IDCT Dequantization Decoding Source Image Quant. Table Huffman Table
- Biến đổi DCT • DCT biến đổi tín hiệu ảnh từ miền không gian sang miền tần số. • DCT tương tự như Fast Fourier Transform (FFT) nhưng có thể biểu diễn dữ liệu ảnh chỉ bằng một vài hệ số. • Năng lượng ảnh tập chung chủ yếu ở các thành phần tần số thấp, nằm góc trên cùng bên trái của DCT. • Các thành phần tần số cao thường có giá trị thấp trong biến đổi DCT nên có thể loại bỏ để tăng hiệu quả của quá trình nén.
- Biến đổi DCT (Tiếp) 52 55 61 66 70 61 64 73 -145 -30 -61 27 56 -20 -2 0 63 59 55 90 109 85 69 72 4 -22 -61 10 13 -7 -9 5 62 59 68 113 144 104 66 73 47 7 77 -25 -29 10 5 -6 63 58 71 122 154 106 70 69 DCT -49 12 34 -15 -10 6 2 2 67 61 68 104 126 88 68 70 12 -7 -13 -4 -2 2 -3 3 79 65 60 70 77 68 58 75 -8 3 2 -6 -2 1 4 2 85 71 64 59 55 61 65 83 -1 0 0 -2 -1 -3 4 -1 87 79 69 68 65 76 78 94 0 0 -1 -4 -1 0 1 2 • Thành phần DC (i.e., F(0,0)) và AC (i.e., F(u,v) (u,v≠0)) đều là số nguyên, có giá trị nằm trong khoảng từ -1024 đến 1023.
- Lượng tử hóa • Lượng tử hóa loại bỏ những thông tin thừa trong ảnh. Lượng tử hóa là nguyên nhân chủ yếu dẫn đến mất mát thông tin trong các kỹ thuật dựa trên biến đổi DCT. FQ(u,v)=Integer Round (F (u,v)/Q(u,v)) Quantization step size • Bước lượng tử hóa được chọn dựa trên cảm nhận của mắt người. Nó là hàm với các biến gồm đặc trưng ảnh, đặc trưng hiển thị và khoảng cách hiển thị. • Trong ứng dụng, bước lượng tử hóa thường được xác định dựa trên thực nghiệm.
- Lượng tử hóa (Tiếp) 16 11 10 16 24 40 51 61 -26 -3 -6 2 2 -1 0 0 12 12 14 19 26 58 60 55 0 -2 -4 1 1 0 0 0 Tần số tăng dần 14 13 16 24 40 57 69 56 -3 1 5 -1 -1 0 0 0 14 17 22 29 51 87 80 62 -4 1 2 -1 0 0 0 0 18 22 37 56 68 109 103 77 1 0 0 0 0 0 0 0 24 35 55 64 81 104 113 92 0 0 0 0 0 0 0 0 49 64 78 87 103 121 120 101 0 0 0 0 0 0 0 0 72 92 95 98 112 100 103 99 0 0 0 0 0 0 0 0 • Những thành phần tần số cao thường có giá trị bằng 0 hoặc rất nhỏ (kể cả giá trị âm và giá trị dương) nên có thể được biểu diễn bằng một vài bit.
- Mã hóa Entropy DC DPCM Q Huffman F (u,v) coding 01101 AC RLC • Mã hóa Entropy là dạng đặc biệt của nén không mất mát thông tin. • Mã hóa Entropy gồm các bước sau: (1) sắp xếp các thành phần ảnh theo đường díc dắc; (2) mã hóa các thành phần ảnh bằng mã loạt dài (RLC) và Huffman.
- Đường díc dắc -26 -3 -6 2 2 -1 0 0 -26 -3 -6 2 2 -1 0 0 0 -2 -4 1 1 0 0 0 0 -2 -4 1 1 0 0 0 -3 1 5 -1 -1 0 0 0 -3 1 5 -1 -1 0 0 0 -4 1 2 -1 0 0 0 0 -4 1 2 -1 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 • Tất cả các hệ số đều nằm trên đường díc dắc. Các thành phần tần số thấp (thường khác 0) được xếp trước các thành phần tần số cao.
- DPCM và Mã loạt dài • Các thành phần DC của các khối ảnh lân cận có tính tương quan cao. Vì vậy, mã hóa sự sai khác giữa các thành phần trên làm tăng tính hiệu quả của quá trình nén. DCi-1 DCi DIFF = DCi - DCi-1 • Mã loạt dài được sử dụng để mã hóa các thành phần AC
- DPCM và Mã loạt dài (Tiếp) • Thành phần DC: +3 à (2),(3) -26 -3 -6 2 2 -1 0 0 • Thành phần AC: 0 -2 -4 1 1 0 0 0 ▫ (0,2) (-3) -3 1 5 -1 -1 0 0 0 ▫ (1,2) (-3) -4 1 2 -1 0 0 0 0 ▫ (0,2) (-2) ▫ (0,3) (-6) 1 0 0 0 0 0 0 0 ▫ (0,2) (2) 0 0 0 0 0 0 0 0 ▫ 0 0 0 0 0 0 0 0 ▫ (0,0) à EOB 0 0 0 0 0 0 0 0 • Các thành phần AC được mô tả bởi một cặp ký hiệu (loạt dài, kích thước) (biên độ). Loạt dài được tính bằng số lượng 0 giữa hai thành phần khác 0. Kích thước biểu diễn số lượng bit dùng để mã hóa giá trị biên độ.
- Mã Huffman • Thực hiện tăng hiệu quả nén bằng việc thay thế những chuỗi ký tự dài bằng những từ mã ngắn. • Độ dài của mỗi từ mã được xác định dựa trên tần suất xuất hiện của các ký tự. • JPEG cung cấp bảng mã Huffman chuẩn, nhưng bảng mã Huffman cũng có thể được định nghĩa riêng tùy thuộc vào ứng dụng và đặc trưng của các ảnh sử dụng trong ứng dụng.
- Mã Huffman (Tiếp) Category Values Bits for the value 1 -1,1 0,1 2 -3,-2,2,3 00,01,10,11 3 -7,-6,-5,-4,4,5,6,7 000,001,010,011,100,101,110,111 4 -15, ,-8,8, ,15 0000, ,0111,1000, ,1111 5 -31, ,-16,16, 31 00000, ,01111,10000, ,11111 6 -63, ,-32,32, 63 000000, ,011111,100000, ,111111 7 -127, ,-64,64, ,127 0000000, ,0111111,1000000, ,1111111 8 -255, ,-128,128, ,255 9 -511, ,-256,256, ,511 10 -1023, ,-512,512, ,1023 11 -2047, ,-1024,1024, ,2047 Giá trị và số lượng bit cho mỗi giá trị
- Mã Huffman (Tiếp) Run, category Code Length Codeword 0,0 4 1010 0,1 2 00 0,2 2 01 0,10 16 1111111110000011 1,1 4 1100 1,2 5 11011 15,10 16 1111111111111110 Bảng mã Huffman chuẩn cho các thành phần AC của kênh độ chói
- Mã Huffman (Tiếp) Category Code Length Codeword 0 2 00 1 3 010 2 3 011 3 3 100 4 3 101 5 3 110 6 4 1110 7 5 11110 8 6 111110 9 7 1111110 10 8 11111110 11 9 111111110 Bảng mã chuẩn cho các thành phần DC của kênh độ chói
- Mã Huffman (Tiếp) • Thành phần DC: +3 à (2),(3) • Từ mã của thành phần DC: 011 11 • Thành phần AC: (0,2) (-3), (1,2) (-3) EOB • Từ mã của thành phần AC: 01 00 11011 00 00
- Minh Họa 1 2 3 1. Q = 100 - 83,2 bytes 2. Q = 50 - 15,1 bytes 3. Q = 25 - 9,5 bytes 4. Q = 10 - 4,7 bytes 5. Q = 5 - 1,5 bytes 4 5
- Chuẩn nén khác? • Với tỷ lệ nén cao (ví dụ 0.25 bpp), méo của chuẩn JPEG là không thể chấp nhận. • JPEG có 44 cách thức, rất nhiều trong số đó không được sử dụng trong bộ mã hóa JPEG. • Chất lượng của ảnh giảm đi rõ rệt nếu xuất hiện lỗi trong quá trình truyền ảnh. • JPEG được tối ưu hóa cho ảnh tự nhiên những không phù hợp với ảnh đồ họa. • JPEG không áp dụng được cho ảnh nhị phân.
- Chuẩn JPEG2000 • Đặc trưng ▫ Biến đổi sóng con Wavelet ▫ Chất lượng tốt với tỷ lệ nén cao ▫ Nén ảnh nhị phân ▫ Nén mất mát và không mất mát thông tin ▫ Linh hoạt với lỗi trong quá trình truyền ▫ Có khả năng mở rộng ▫ Chọn vùng quan tâm ROI • Một vài ứng dụng ▫ Website ▫ Camera kỹ thuật số ▫ Ảnh y học ▫ Ảnh viễn thám
- Chuẩn JPEG2000 (Tiếp) Lossless 5.2 bpp Lossy b Original image it s t r e a m 1.89 bpp
- Chuẩn JPEG2000 (Tiếp) 0.125 bpp JPEG vs. JPEG2000 0.25 bpp
- Chuẩn JPEG2000 (Tiếp) • Disadvantages ▫ Thiết bị mã hóa và giải mã phức tạp, thời gian tính toán lâu. ▫ Khi tỷ lệ nén khoảng 1:25, JPEG2000 so với JPEG có thể tạo ra ảnh nén ít bị chia ô nhưng giảm đang kể các chi tiết ảnh.
- AUDIO Trần Quang Đức
- Định nghĩa • Sóng âm thanh là dao động cơ học của các phân tử, nguyên tử được lan truyền trong môi trường vật chất. • Sóng âm thanh có các tính chất chung của sóng như phản xạ, khúc xạ, tán xạ v.v • Tần số biểu diễn số chu kỳ trong một giây và được đo bằng hertz (Hz) hoặc chu kỳ trên giây. • Biên độ đặc trưng cho độ lớn của dao động so với giá trị trung bình. Biên độ liên quan nhưng không phải là âm lượng
- Âm thanh số • Tín hiệu âm thanh được chuyển sang dạng nhị phân ▫ Lấy mẫu ▫ Lượng tử • Tần số lấy mẫu ▫ Âm thanh thoại: 8 kHz ▫ CD-audio: 44.1 kHz • Lượng tử hóa ▫ Âm thanh thoại: 8 bit ▫ CD-audio: 16 bit • Số lượng rãnh âm thanh ▫ Stereo: 2 kênh ▫ Chuyên nghiệp: 16, 32 hoặc hơn nữa.
- Âm thanh số (Tiếp) • Ví dụ 1: Số hóa mẫu 4s đối với âm thanh thoại ▫ Âm thanh thoại được lấy mẫu với tần số 8 kHz, một mẫu được lượng tử bằng 8 bit, chỉ có một rãnh âm thanh. • Ví dụ 2: Số hóa 4s âm nhạc ▫ Tín hiệu âm nhạc được lấy mẫu với tần số 44.1 kHz, một mẫu được lượng tử bằng 8 bit và có 2 rãnh âm thanh.
- Nén âm thanh • Differential Pulse Code Modulation (DPCM) • DPCM thích nghi (Adaptive DPCM) • Linear Predictive Coding (LPC) • Perceptual Coding • Chuẩn MPEG
- DPCM • Sự sai khác về biên độ giữa hai mẫu âm thanh nhỏ hơn nhiều so với biên độ của mẫu. Sự sai khác có thể được lượng tự hóa với một vài bit. • Bộ mã hóa DPCM có thiết kế đơn giản. Ước lượng được thực hiện dựa trên mẫu thu được trước đó. • Những mẫu âm nhạc liên tiếp có tính tương quan cao. DPCM vì thế hiệu quả và cho chất lượng âm thanh tốt hơn PCM.
- DPCM (Tiếp) Speech Input AAF ADC Subtractor Parallel- Signal to-serial converter Register Timing + Adder Control R Network Speech Register Output LPF DAC Adder Serial-to- R Signal parallel converter Timing + Control
- DPCM (Cont.) • Mã hóa ▫ Giá trị mẫu trước đó được lưu trong bộ ghi. ▫ Tín hiệu DPCM được tạo ra bằng cách trừ giá trị mẫu hiện tại với giá trị mẫu trước đó lưu trong bộ ghi ▫ Giá trị trong bộ ghi được cập nhật trước khi truyền tín hiệu • Giải mã ▫ Cộng giá trị của tín hiệu DPCM với giá trị mẫu được lưu trong bộ ghi. ▫ Quá trình lượng tử hóa sinh ra lỗi lượng tử. Lỗi lượng tử tăng tỷ lệ với số mẫu được mã hóa.
- Third-order predictive DPCM Speech Input AAF ADC Subtractor Parallel- Signal to-serial Adder converter Timing + C1 x C2 x C3 x Control R1 R2 R3 Network Speech Output LPF DAC Adder Serial-to- Signal parallel converter Timing + C1 x C2 x C3 x Control R1 R2 R3
- Third-order predictive DPCM (Tiếp) • Để giảm nhiễu, bộ mã hóa DPCM ước lượng giá trị mẫu hiện tại dựa trên giá trị của ba mẫu trước đó. • Giá trị của ba mẫu được kết hợp với tỷ lệ khác nhau, định nghĩa bằng tham số Ci. Ci được gọi là tham số dự đoán. • Tín hiệu sai khác được tính bằng cách trừ giá trị mẫu hiện tại với giá trị dự đoán.
- Third-order predictive DPCM (Tiếp) • Tạo tín hiệu DPCM bằng cách trừ tín hiệu PCM với giá trị kết hợp của các mẫu được lưu tại bộ ghi R1, R2 và R3. • Ghi giá trị mới PCM vào R1. Chuyển giá trị R1 tới R2 và R2 tới R3. • Thiết bị giải mã hoạt động dựa trên nguyên tắc tương tự. Tín hiệu DPCM được cộng với giá trị kết hợp của các mẫu trước đó được lưu trong bộ ghi R1, R2 và R3
- Adaptive DPCM (ADPCM) • Có thể tiết kiệm băng thông bằng cách sử dụng số lượng bit khác nhau để mã hóa sự sai khác dựa trên biên độ của nó. • Chuẩn quốc tế tương ứng được định nghĩa tại ITU-T Recommendation G.721. • Nguyên tắc cũng tương tự như DPCM, chỉ khác là sử dụng bộ dự đoán dựa trên 8 mẫu trước đó và thay đổi số lượng bit để mã hóa sự sai khác. • Bước lượng tử hóa lớn được sử dụng cho những sự sai khác của thành phần tần số cao. Ngược lại sự sai khác của thành phần tần số thấp sẽ được số hóa với bước lượng tử hóa nhỏ.
- Sub-band ADPCM Lower sub-band Lower sub-band 48 kbps bandlimiting filter ADPCM encoder Speech (50Hz-3.5 kHz) Input Multiplexer Signal Upper sub-band Upper sub-band 16 kbps bandlimiting filter ADPCM encoder (3.5kHz-7kHz) Network Lower sub-band Lower sub-band 48 kbps low-pass filter ADPCM decoder Speech (50Hz-3.5 kHz) Output Demultiplexer Signal Upper sub-band Upper sub-band 16 kbps low-pass filter ADPCM decoder (3.5kHz-7kHz)
- Sub-band ADPCM • Sub-band ADPCM được định nghĩa bởi chuẩn ITU-T Recommendation G.722 (chất lượng âm thanh tốt hơn cho ứng dụng VoIP). • Kỹ thuật sử dụng mã hóa dải băng tần con, tín hiệu đầu vào được đi qua hai bộ lọc dải tần, một từ 50 Hz đến 3.5 kHz và một từ 3.5 kHz đến 7 kHz. • Hai tín hiệu sau đó sẽ được số hóa với các thiết bị ADPCM khác nhau. 6 bit được dùng để lượng tử hóa tín hiệu thuộc dải tần thấp và 2 bit được dùng để lượng tử hóa tín hiệu thuộc dải tần cao.
- Linear Predictive Coding • Mã dự đoán tuyến tính (LPC) được xây dựng dựa trên việc xấp xỉ giá trị mẫu âm thanh hiện tại bằng tổ hợp tuyến tính của những giá trị mẫu trước đó. Quá trình xấp xỉ thực hiện trên những đoạn ngắn, gọi là khung hình. 30-50 khung hình một giây cho chất lượng âm thanh chấp nhận được với tỷ lệ nén cao. Order of the model Prediction coefficient p x[n] a x[n k] e[n] = ∑ k − + k=1 Previous speech samples Prediction error
- Linear Predictive Coding (Tiếp) • Các tham số dự đoán được xác định nhằm cực tiểu hóa trung bình bình phương sự sai khác giữa giá trị của mẫu âm thanh thật và mẫu dự đoán. • Số lượng mẫu tham gia dự đoán p tỷ lệ thuận với độ chính xác của quá trình xấp xỉ. • Âm thanh thoại chưa nén yêu cầu đường truyền tốc độ 64 kbps. LPC có thể truyền âm thanh trên với 2.4 kbps. Tín hiệu bị mất mát nhiều nhưng vẫn đảm bảo được chất lượng âm thanh tối thiểu. • LPC được sử dụng trong các dịch vụ viễn thông như GSM.
- Code-excited LPC (CELPC) • CELPC sử dụng tập mẫu chuẩn thay cho tập mẫu thu nhận trước đó để dự đoán giá trị của mẫu hiện tại. • Tập mẫu chuẩn tạo thành bảng mã và được lưu trong cả thiết bị mã hóa và giải mã. • Mỗi một mẫu được mã hóa riêng biệt dựa trên tập mẫu chuẩn. Giá trị tham số dự đoán được truyền đi thay cho giá trị hoặc giá trị sai khác của mẫu.
- Perceptual Coding • LPC và CELPC được dùng trong các ứng dụng thoại. PC được thiết kế để nén âm thanh trong những dịch vụ truyền hình quảng bá. • Mẫu âm thanh được phân tích, chỉ những đặc trưng phù hợp với cảm nhận của tai người là được truyền đi. • Mặc dù tai người nhạy cảm với tín hiệu âm thanh trong dải từ 15 Hz to 20 kHz, nhưng độ nhạy của tai người với mỗi tín hiệu là không tuyến tính.
- Độ nhạy của tai người • Độ nhạy của tai người với tín hiệu có tần số khác nhau. Tín hiệu trong khoảng 2-5 kHz được cảm nhận tốt nhất. • Biểu đồ vẽ cường độ lớn nhất và nhỏ nhất mà tai người có thể nghe ứng với mỗi tần số. Tín hiệu A nằm trên giá trị ngưỡng nghe Tín hiệu B nằm dưới giá trị ngưỡng nghe.
- Mặt nạ tần số Tín hiệu B có cường độ lớn hơn tín hiệu A. Nó làm cho độ nhạy của tai bị thay đổi xung quanh tín hiệu B. Tai người không còn nghe thấy tín hiệu A . • Khi nhiều tín hiệu cùng xuất hiện, tín hiệu có cường độ cao có thể tạo ra méo và làm thay đổi độ nhạy của tai người ở vùng tần số xung quanh tần số của tín hiệu.
- Mặt nạ tần số (Tiếp) Độ rộng của đường cong ứng với tần số nhất định được gọi là dải tần tới hạn. Dải tần tới hạn thay đổi theo tấn số. • Nếu biên độ của các thành phần tần số tạo nên âm thanh được xác định, có thể xác định được những thành phần bị che khuất và không cần truyền hoặc mã hóa.
- Mặt nạ không gian Sau khi nghe một âm thanh có cường độ lớn, cần một thời gian để tai người có thể nghe âm thanh cường độ nhỏ hơn. Hiệu ứng đó được gọi là mặt nạ không gian. • Trong khoảng thời gian này, tai người không thể cảm nhận được những âm thanh có cường độ thấp hơn giá trị ngưỡng. Những âm thanh đó không cần truyền hoặc mã hóa.
- Chuẩn nén MPEG Signal-to-mask Masking ratios + Bit Threshold allocations . 1 Q1 2 Q2 Format frame Speech PCM Analysis filter for Input Encoder bank (DFT) Signal transmission 32 Q32
- Chuẩn nén MPEG (Tiếp) • Dải tần của tín hiệu được chia thành 32 dải tần con bằng các bộ lọc dải thông. • Mô hình cảm âm xử lý tín hiệu thu từ các bộ lọc với mạt nạ tần số và mặt nạ không gian. Mô hình cảm âm chỉ giữ lại những thành phần tần số có biên độ nằm trên ngưỡng cảm âm để tăng tỷ lệ nén và tiết kiệm băng thông đường truyền. • Các thành phần tần số nhạy cảm với tai người được số hóa với nhiều bit hơn những thành phần tấn số khác.
- VIDEO Trần Quang Đức
- Video tương tự • Tín hiệu video là một chuỗi các ảnh 2 chiều được chuyển sang không gian 3 chiều thông qua các thiết bị camera. • Thiết bị thu nhận cường độ ánh sáng phát ra hoặc phản xạ từ vật thể. Cường độ ánh sáng thay đổi theo cả chiều không gian và thời gian.
- Video Đa hợp và Thành phần • Trong trường hợp lý tưởng, tín hiệu video màu được miêu tả bởi ba thành phần khác nhau, mỗi thành phần là một kênh màu. Video được gọi là video thành phần. • Video đa phức tổng hợp ba kênh màu thành một tín hiệu duy nhất. Video đa phức có yêu cầu về băng thông nhỏ hơn video thành phần, vì thế có thể tăng khả năng lưu trữ. • S-video gồm hai thành phần, thành phần màu và thành phần độ chói.
- Quét mành • Hệ thống truyền hình tương tự sử dụng kỹ thuật quét mành (có thể là quét xen kẽ hoặc quét liên tục) để thu nhận và hiển thị video. • Một khung hình được chia ra thành nhiều đường gồm đường chẵn và lẻ. Kỹ thuật quét xen kẽ quét tất cả các đường lẻ, sau đó quét tất cả các đường chẵn trên màn hình. • Kỹ thuật quét liên tục quét đồng thời cả dòng chẵn và lẽ theo thứ tự từ trên xuống dưới.
- Tốc độ làm mới • Tốc độ làm mới là tần số để hiển thị hai khung hình liên tiếp, được đo bằng Hz hoặc số khung hình/s. • Ngành công nghiệp điện ảnh sử dụng tốc độ làm mới 24 khung hình/s. • Với băng thông cố định, kỹ thuật quét xen kẽ có tốc độ làm mới gấp hai lần kỹ thuật quét liên tục. Tốc độ làm mới cao cho phép miêu tả tốt chuyển động của đối tượng. • Tuy nhiên, kỹ thuật quét xen kẽ không thích hợp để thu nhận và hiển thị những đối tượng chuyển động nhanh.
- Hệ thống Truyền hình tương tự Tham số đánh giá NTSC PAL SECAM Tốc độ làm mới (Field rate) 59.94 50 50 Số đường quét/khung hình 525 625 625 Tốc độ quét (Đường quét/s) 15,750 15,625 15,625 Băng tần kênh độ chói (MHz) 4.2 5.0, 5.5 6.0 Băng tần kênh màu (MHz) 1.5 (I), 0.5 (Q) 1.3 (U,V) 1.0 (U,V) Tần số mang của tín hiệu âm thanh 4.5 5.5, 6.0 6.5 Băng tần tín hiệu đa phức (MHz) 6.0 8.0, 8.5 8.0 • HDTV tăng hiệu quả hiển thị với kích thước màn hình 16:9 và tốc độ làm mới 60 khung hình/s, và 720 đường/khung hình. • Màn hình máy tính (ví dụ SVGA) có độ phân giải cao 1024x720 điểm ảnh và 72 khung hình/s.
- Video số • Video số có thể thu nhận dựa trên việc lấy mẫu tín hiệu truyền hình tương tự, hoặc sử dụng video camera số. • Chuẩn BT. 601 có tốc độ lấy mẫu 13.5 MHz cho tất cả các hệ thống NTSC và PAL/SECAM. • BT.601 cũng định nghĩa hệ hiển thị màu mới gọi là YCbCr (xem Giảm mẫu kênh màu). • Ngoài BT.601, CIF (Common Intermediate Format) cho chất lượng video với độ phân giải bằng một nửa BT.601.
- Nén Video • International Telecommunication Union (ITU-T) ▫ H.261: ISDN Video Phone (px64 kb/s) ▫ H. 263: PSTN Video Phone (<64 kb/s) ▫ H.26L: Nhiều ứng dụng khác nhau (<64 kb/s) Truyền hình theo yêu cầu, Video Mail • International Organization for Standard (ISO) ▫ MPEG-1 Video: CD-ROM (1.2 Mb/s) ▫ MPEG-2 Video: SDTV, HDTV (4-80 Mb/s) ▫ MPEG-4 Video: Nhiều ứng dụng khác nhau (24-1024 kb/s) • MJEG (Moving JPEG) dựa trên chuẩn nén JPEG áp dụng độc lập trên tất cả các khung hình.
- Nén Video (Tiếp) • Tín hiệu video gồm miền không gian (không gian 2 chiều) và miền thời gian. Nén video vì thế có thể thực hiện trên cả miền không gian và miền thời gian. • Ở miền không gian – thiết bị mã hóa thực hiện nén JPEG để giảm thông tin dư thừa. Nén JPEG được áp dụng trên khối ảnh có kích thước 8x8 điểm ảnh. • Ở miền thời gian – thiết bị mã hóa thực hiện ước lượng chuyển động để giảm không gian dư thừa. Ước lượng chuyển động được áp dụng trên khối ảnh có kích thước 16x16 điểm ảnh.
- Ước lượng chuyển động • Ước lượng chuyển động (motion estimation) được thực hiện trên những dạng khung hình khác nhau. Độ tương quan giữa các khung hình được xác định dựa trên véc tơ chuyển động (motion vector)
- Ước lượng chuyển động (Tiếp) • Ước lượng chuyển động chính xác tạo ra tỷ lệ nén cao và chất lượng video tốt. • Ước lượng chuyển động được thực hiện trên những khối ảnh có kích thước 16x16 điểm ảnh. Kích thước khối ảnh nhỏ tăng độ chính xác của ước lượng chuyển động nhưng độ phức tạp của tính toán cao. • Véc tơ chuyển động chỉ được xác định nếu như sự sai khác chuyển động giữa hai khung hình lớn hơn ngưỡng cho trước.
- Ước lượng chuyển động (Tiếp) • Kỹ thuật đối sánh khối ảnh (Block Matching) được dùng để ước lượng chuyển động. • Mỗi khối ảnh của khung hình hiện tại được so sánh với các khối ảnh nằm trong khu vực tìm kiếm của khung hình trước đó. • Khu vực tìm kiếm thường có kích thước hình chữ nhật, do chuyển động thường diễn ra theo phương ngang. • Ước lượng chuyển động được thực hiện dựa trên kênh độ chói, tuy nhiên thông tin màu có thể thêm vào để tăng độ chính xác của phép ước lượng.
- Bù chuyển động • Chuyển động trong video rất phức tạp. Ước lượng chuyển động thường không chính xác tuyệt đối. • Kỹ thuật bù chuyển động được sử dụng để tính toán sự sai khác giữa ví trị thật và vị trí ước lượng của đối tượng. • Tương tự như DPCM, sự sai khác có thể được mã hóa với chỉ một vài bit.
- Quá trình Ước lượng chuyển động Current Entropy DCT Quantization Bit stream Frame Coding Reference Motion Compensation Frames Frame N-1 Motion Estimation Frame N Véc tơ chuyển động
- Chuẩn MPEG • MPEG-1: Chuẩn nén audio/video cơ bản ▫ Tốc độ dữ liệu: 1.5 Mbps ▫ Video: 352x240 điểm ảnh/khung hình, 30 khung hình/s ▫ Audio: 2 kênh, 48,000 mẫu/s, 16 bit/mẫu • MPEG-2: cho chất lượng audio/video tốt hơn ▫ Tốc độ dữ liệu: 4-80 Mbps ▫ Video: 720x480 điểm ảnh/khung hình, 30 khung hình/s ▫ Audio: 5.1 kênh, Advanced Audio Coding (AAC) • MPEG-4: nhiều ứng dụng với chất lượng và tốc độ dữ liệu khác nhau.
- Thứ tự khung hình trong MPEG Forward Motion Compensation I B B P B B P B B I Bidirectional Motion Compensation Khung I: Intra-coded frame Khung P: Dự đoán chuyển động dựa trên khung trước đó Khung B: Dự đoán chuyển động dựa trên khung trước đó và khung sắp tới
- Khung I • Khung I được mã hóa độc lập. Mỗi khung là một ảnh tĩnh và ma trận Y, Cb và Cr được mã hóa với chuẩn nén JPEG. • Khung I được nhắc lại để tránh lỗi tích lũy trong quá trình truyền. • Khung hình nằm giữa hai khung I liên tiếp tạo thành một nhóm khung hình (group of pictures - GOP). Một nhóm khung hình thường có kích thước từ 3 đến 12 khung hình.
- Khung P • Mã hóa khung P sử dụng khung P hoặc khung I trước đó bằng kỹ thuật ước lượng và bù chuyển động. ▫ Mã hóa và truyền địa chỉ khối ảnh trên khung P hoặc I trước đó nếu nội dung không thay đổi. ▫ Mã hóa và truyền véc tơ chuyển động, sự sai khác nếu nội dung của khối ảnh thay đổi nhỏ hơn giá trị ngưỡng. ▫ Mã hóa và truyền khối ảnh với chuẩn nén JPEG nếu nội dung thay đổi lớn hơn giá trị ngưỡng. • Số lượng khung P giữa hai khung I bị giới hạn để giảm lỗi tích lũy.
- Khung B • Kỹ thuật ước lượng chuyển động chỉ hoạt động hiệu quả với những video có chuyển động chậm. • Với những video có chuyển động nhanh, khung B (Bi- directional) được sử dụng. Nội dung của khung B được dự đoán dựa trên khung P hoặc I trước đó và khung P hoặc I sắp tới. • Khung B có tỷ số nén cao nhất. Nội dung của khung B không được sử dụng để ước lượng hoặc dự đoán các khung khác.
- Thiết bị mã hóa MPEG-1 Coding Input Control Coded Bit Video + stream DCT Q Entropy Buffer - Coding Q-1 IDCT + + Q: Quantization Q-1: Inverse Quantization Motion Reference Compensation Frames Motion Vector Motion Estimation
- Thiết bị giải mã MPEG-1 Coded Bit Output Stream Video Entropy + Frame Buffer Q-1 IDCT Decoding Ordering + Motion Motion Vector Compensation Reference Frames
- Hiệu năng của MPEG-1 • Nén khung I cũng tương tự như JPEG với tỷ số nén trong khoảng từ 1:10 đến 1:20, phụ thuộc vào độ phức tạp của nội dung khung hình • Khung P và B có tỷ lệ nén cao hơn. Tỷ lệ nén của khung P trong khoảng từ 1:20 đến 1:30. Tỷ lệ nén của khung B trong khoảng từ 1:30 đến 1:50.
- Cấu trúc dòng dữ liệu MPEG-1 Video sequence #n-1 Video sequence #n Video sequence #n+1 Sequence Header GOP #p GOP #p+1 GOP #p+2 GOP #p+3 GOP #p+4 GOP #p+5 GOP Header Frame I Frame B Frame B Frame P Frame Header MB MB MB MB MB MB MB MB MB MB MB MB MB MB Slide Header Motion Vector Block Y Block Y Block Y Block Y Block Cb Block Cr MB Header
- Chuẩn MPEG-2 • Chuẩn MPEG-2 cho chất lượng video cao với tốc độ dữ liệu 4 Mbps, đáp ứng yêu cầu của các dịch vụ truyền hình theo yêu cầu (VOD), truyền hình chuẩn SD, truyền hình chất lượng cao HD và DVD • Chuẩn MPEG-2 hỗ trợ nhiều kỹ thuật quét màn hình khác nhau bao gồm cả kỹ thuật quét xen kẽ. • Chuẩn MPEG-2 cho phép mã hóa mở rộng (scalable coding) và bao gồm nhiều kỹ thuật hạn chế lỗi đường truyền và hiển thị.
- Kỹ thuật quét xen kẽ trong MPEG-2 Progressive Scan Interlaced Scan
- Kỹ thuật quét thay thế trong MPEG-2 Zigzag scan Alternative scan • Tính tương quan giữa các khung hình thu được từ kỹ thuật quét xen kẽ thấp. Do vậy kỹ thuật quét theo đường díc dắc trên khối ảnh sau biến đổi DCT hoạt động không tốt. Kỹ thuật quét thay thế (Alternative scan order) được đề xuất để tăng hiệu quả của quá trình mã hóa.
- Mã hóa mở rộng trong MPEG-2 • Mã hóa mở rộng chia video thành nhiều lớp gồm lớp cơ bản và lớp nâng cao. • Lớp cơ bản được mã hóa, nén và truyền trước. Nếu như hạ tầng mạng cho phép, lớp nâng cao cũng được mã hóa, nén và truyền để tăng chất lượng của video. • Mã hóa mở rộng cho phép mở rộng về chất lượng (SNR scalability), mở rộng về không gian (spatial scalability), mở rộng về thời gian (temporal scalability) hoặc mở rộng kết hợp.
- Chuẩn MPEG-4 • Chuẩn MPEG-4 được sử dụng trong các ứng dụng đa phương tiện có tính chất tương tác hoặc các ứng dụng giải trí khác trên mạng internet. • Chuẩn MPEG-4 cung cấp các công cụ để can thiệp vào các đối tượng hiển thị trong video. • Trong chuẩn MPEG-4, mỗi khung hình được chia thành nhiều mặt phẳng đối tượng (Video Object Plane – VOP). Mỗi mặt phẳng đối tượng tương ứng với một đối tượng video và audio được quan tâm (Audio Visual Object – AVO).
- Chuẩn MPEG-4 (Tiếp) • Mỗi đối tượng audio và video có thông tin miêu tả (object descriptor) cho phép can thiệp vào đối tượng trước khi giải mã và hiển thị. • Trước khi nén, mỗi khung hình sẽ được chia thành nền (background) và một hoặc nhiều đối tượng AVO. • Audio liên quan đến đối tượng AVO được mã hóa dựa trên yêu cầu về chất lượng và tốc độ đường truyền cho phép.
- Chuẩn MPEG-4 (Tiếp) VOP 0 encoding VOP VOP 1 Video Input Identification encoding Transmission + Definition Multiplexer VOP 2 encoding Audio Input Audio encoding
- HỆ THỐNG TRUYỀN THÔNG ĐA PHƯƠNG TIỆN Trần Quang Đức
- Yêu cầu của người dùng • Hỗ trợ nhiều kiểu dữ liệu đa phương tiện khác nhau dựa trên hạ tầng có sẵn như máy trạm và mạng. • Quản lý ứng dụng đa phương tiện như quản lý tương tác, quản lý chất lượng kết hợp với giao diện sử dụng thân thiện. • Hỗ trợ người dùng thông minh tùy biến theo nhu cầu của từng cá nhân.
- Yêu cầu về mạng • Tốc độ đường truyền cao ▫ Các ứng dụng đa phương tiện, đặc biệt là các ứng dụng ảnh và video có yêu cầu cao về tốc độ đường truyền. Để có thể đáp ứng, nhà cung cấp cũng như người dùng cần phải trang bị mạng cáp quang và các thiết bị xử lý phức tạp với giá thành cao. • Chất lượng dịch vụ ▫ Tài nguyên mạng cần phải đảm bảo chất lượng cho các dịch vụ đa phương tiện, như tỷ lệ lỗi bit (bit error rate), tỷ lễ mất gói tin (packet loss), độ trễ (delay) và biến thiên độ trễ (delay variation).
- Yêu cầu về mạng (Tiếp) • Đồng bộ dữ liệu ▫ Đồng bộ dữ liệu liên quan đến mối quan hệ thời gian giữa các đối tượng đa phương tiện. Ví dụ về đồng bộ dữ liệu như phim hoặc truyền hình quảng bá với đồng bộ giữa âm thanh và hình ảnh hiển thị. • An toàn, an ninh và tường lửa ▫ An toàn, an ninh mạng bao gồm các tính năng nhúng dấu ẩn, bảo vệ nội dung đa phương tiện, sinh trắc học, và giao diện giao tiếp người và máy. ▫ Tường lửa dùng để điều khiển và kiếm soát dữ liệu vào ra dựa vào tập luật.
- MẠNG ĐA PHƯƠNG TIỆN Trần Quang Đức
- Mạng Đa phương tiện • Mạng diện rộng (Wide-Area Network) ▫ Mạng diện rộng là mạng dữ liệu gồm nhiều nút mạng, kết nối giữa các máy tính thuộc nhiều khu vực địa lý khác nhau. Mạng WAN được tích hợp dựa trên hai công nghệ chuyển mạch kênh và chuyển mạch gói. • Mạng cục bộ (Local Area Network) ▫ Mạng LAN kết nối các máy tính trong phạm vị hẹp, một tòa nhà hoặc một vài tòa nhà. Tốc độ đường truyền trong mạng cục bộ lớn hơn so với mạng diện rộng.
- Công nghệ mạng nội bộ Đặc tính FDDI Ethernet Token Ring Tốc độ baud 125 MBAUD 20 MBAUD 8 & 32 MBAUD Tốc độ dữ liệu 100 Mbps 10 Mbps 4 & 16 Mbps 4B/5B Manchester Diff. Manchester Mã hóa Hiệu quả 80% Hiệu quả 50% Hiệu quả 50% 100 km 2.5 km Configuration Phạm vi (UTP, Fiber) (Coax., UTP, Fiber) dependent Số nút mạng tối đa 500 1024 250 Khoảng cách tối đa 2 km (MMF) 300 m 2.5 km giữa các nút mạng 40 km (SMF) Khuyến nghị 100 m FDDI: Fiber Distributed Data Interface
- Đặc tính của FDDI • FDDI sử dụng cấu trúc mạng vòng với cáp quang single mode hoặc multimode mode có tốc độ dữ liệu 100 Mbps trong phạm vi 100 km và có thể liên kết với 500 nút mạng. • FDDI được thiết kế để xử lý hai loại dữ liệu: ▫ Dữ liệu đồng bộ, có yêu cầu chặt chẽ về độ trễ (ví dụ âm thanh và video). ▫ Dữ liệu không đồng bộ, cho phép độ trễ lớn hơn nhưng yêu cầu cao về tính đảm bảo (ví dụ, dữ liệu). • FDDI sử dụng TTRT (Target Token Rotation Time) để đảm bảo thời gian quay vòng của gói tin dưới một ngưỡng cho trước.
- Các lớp của FDDI Logical Link Control (LLC) Data Link Layer Media Access Control (MAC) Station Management (SMT) Physical (PHY) Physical Layer Physical medium dependent (PMD)
- Các lớp của FDDI (Tiếp) • Lớp vật lý cung cấp các hàm chuyển đổi dữ liệu để có thể kết nối với tầng vật lý trong mô hình tham chiếu OSI, như chuyển từ PMD sang dòng các ký hiệu và dữ liệu, hoặc các ký hiệu điều khiển sang PMD. • Tầng điều khiển truy nhập môi trường (MAC) cung cấp khả năng truy nhập môi trường công bằng (các nút mạng có mức độ ưu tiên như nhau) và tất định (trong trường hợp không có lỗi, thời gian để một nút mạng có thể truy nhập môi trường là có thể dự đoán) • SMT cung cấp khả năng giám sát và quản lý mạng. Nó không được định nghĩa trong mô hình tham chiếu OSI.
- Ưu điểm của FDDI • Tốc độ dữ liệu cao (100 Mbps) • Khoảng cách lớn giữa các nút mạng, độ suy hao nhỏ trong quá trình truyền (≤0.3 dB/km) • Tỷ số SNR (Signal-to-Noise ratio) cao do không bị ảnh hưởng nhiễu và giao thoa tín hiệu từ môi trường bên ngoài • Tỷ lệ lỗi bit (10-11) tốt hơn so với cáp đồng (10-5) và hệ thống sử dụng sóng vi ba (10-7). • Khó trích rút tín hiệu trong cáp quang.
- Nhược điểm của FDDI • Giá thành cáp quang và các thiết bị truyền và nhận tín hiệu cao (đặc biệt với cáp quang single mode) • Quá trình tính hợp phức tạp so với các công nghệ LAN khác như Ethernet và Fast Ethernet.
- Công nghệ WAN • Public Switched Telephone Network (PSTN) • Integrated Service Digital Network (ISDN) • Broadband ISDN • Wireless Network (chú ý: wireless LAN) • Broadcast Channel: Terrestrial, Cable, Satellite.
- PSTN • Được biết đến với cái tên Plain Old Telephone Service (POTs) • Tất cả điện thoại đều được kết nối với nhau bằng đường truyền vật lý. • Cáp đồng sử dụng có tốc độ thấp (56 Kbps), không thể truyền video với chất lượng mong muốn. • Các công nghệ ADSL (Asymmetric Digital Subscriber Loop) cho tốc độ dữ liệu lên đến 6 Mbps, cho phép truyền video theo chuẩn MPEG-1, MPEG-2 trong các dịch vụ truyền hình theo yêu cầu (VOD).
- ISDN • ISDN là mạng đầu tiên sử dụng công nghệ truyền số. Tốc độ dữ liệu gấp từ 1 đến 24 lần tốc độ của kênh cơ bản (B channels) với 64 Kbps • Thuê bao cơ bản của ISDN được cung cấp đường truyền có tốc độ 2B+D, với kênh D có tốc độ 16 Kbps được sử dụng để bắt tay (signaling). Ở 128 Kbps, có thể xem video với chất lượng thấp. • Kết nối ISDN rất đảm bảo. H.320 (khuyến nghị đầu tiên cho các dịch vụ audio và video) được phát triển cho ISDN.
- ISDN Tốc độ cao • B-ISDN có thể cung cấp các kênh H.0 (384 Kbps), H.11 (1.536 Mbps) và H.12 (1.920 Mbps). B-ISDN yêu cầu hạ tầng phải là cáp đồng trục và cáp quang. • B-ISDN sử dụng gói tin Asynchronous Transfer Mode (ATM) với kích thước cố định (được gọi là tế bào). Kích thước của tế bảo nhỏ (53 Byte với 48 Byte dữ liệu) cho phép B-ISDN hoạt động tốt với các ứng dụng truyền thời gian thực với độ trễ nhỏ. • Mất mát tế bào xảy ra nhưng rất nhỏ (10-6-10-4) cho các ứng dụng truyền video.
- Kích thước tế bào là 53 Bytes? • Kích thước của tế bào được xác định dựa trên mối tương quan giữa độ trễ, và tỷ lệ giữa kích thước của phần đầu và dữ liệu. Tỷ lệ này càng nhỏ nếu kích thước dữ liệu càng lớn. • Tuy nhiên, kích thước tế bào nhỏ có ưu điểm lớn với trường hợp mất mát tế bào trong quá trình truyền. Ví dụ, tế bào 53 Byte chứa 48 mẫu âm thanh, tương đương 48 x 125 µs = 6 ms âm thanh. Mất mát một tế bào hầu như không ảnh hưởng đến chất lượng âm thanh. • 32 Byte là kích thước nhỏ nhất cho phép nhưng có tỷ lệ phần đầu trên dữ liệu 13.5%. 64 Byte dữ liệu thường tạo ra tiếng vọng nhỏ, nhưng có tỷ lệ phần đầu trên dữ liệu 7.1%.
- Dịch vụ của ATM • Constant Bit Rate (CBR) ▫ CBR hỗ trợ các ứng dụng thời gian thật có yêu cầu cao về độ trễ và biến thiên độ trễ (ví dụ, hội nghị truyền hình, thoại qua mạng internet với video). • Variable Bit Rate (VBR) ▫ VBR thời gian thực hỗ trợ các ứng dụng thời gian thực, đồng thời cho phép tận dụng tài nguyên mạng linh hoạt hơn. ▫ VBR không thời gian thực có thể hỗ trợ các ứng dụng thời gian thực, nhưng có độ trễ lớn như đặt vé máy bay, giao dịch điện tử v.v
- Dịch vụ của ATM (Tiếp) • Available Bit Rate (ABR) ▫ ABR hỗ trợ các ứng dụng không phải thời gian thực, cho phép kiểm soát tắc nghẽn vì thiết bị gửi phải giảm tốc tộ truyền gói tin (ví dụ các ứng dụng truyền và phân phối dữ liệu, ảnh hoặc ứng dụng điều khiển từ xa). • Unspecified Bit Rate (UBR) ▫ UBR tương đương với mạng Internet, hỗ trợ các ứng dụng không có yêu cầu về đường truyền.
- Mạng không dây Channel Network Data Rate Mobility Range Quality Cellular Network <20 Kbps High 2.5 km Poor Wireless Data Network 64-384 Kbps High 2.5 km Poor Location Wireless LAN 2-25 Mbps Low (Indoor) 50 m dependent 1-600 Mbps Wireless IP Network Low (Indoor) 3-30 miles Good downlink Cellular Network: GPRS, EDGE (8.8-59.2 Kbps) Wireless Data Network: 3G (BER <10-6) Wireless IP Network (2.15-40 GHz): MMDS (1 Mbps), LMDS (600 Mbps)
- Mạng không dây (Tiếp) • Các ứng dụng truyền video trên mạng không dây thường gặp các vấn đề tốc độ đường truyền thấp, tỷ lệ lỗi trong quá trình truyền cao, và tốc độ dữ liệu luôn thay đổi. • Cho các ứng dụng thật, kỹ thuật FEC (Forward Error Check) có thể dùng để giảm tỷ lệ lỗi một cách đáng kể. • Phần lớn các hệ thống không dây đều sử dụng chuẩn H. 223. H.223 vận chuyển dữ liệu bao gồm cả video đã nén với các gói tin có kích thước thay đổi. Thông thường, kích thước của gói tin khoảng 100 byte để đảm bảo yêu cầu về độ trễ.
- Mạng không dây 3G • 3G cung cấp tốc độ dữ liệu tốt hơn bằng cách sử dụng sóng mang có tần số cao, băng tần rộng và nhiều kỹ thuật tiến tiến trong kiểm soát đa truy nhập và lỗi trong quá trình truyền. • BER cho truyền dữ liệu thường dưới 10-6. • Thông thường, mạng không dây 3G có tỷ lệ lỗi cao. Sử dụng FEC và ARQ có thể hạn chế tối đa lỗi. Tuy nhiên với các ứng dụng có video, số lượng ARQ bị giới hạn, tỷ lệ lỗi bit và độ mất gói tin là những vấn đề phải quan tâm.
- Truyền hình quảng bá • Được sử dụng trong truyền hình quảng bá HDTV sử dụng chuẩn MPEG-2 và kỹ thuật truyền dòng. • Dữ liệu nén được đóng gói trong các gói tin có kích thước 188 byte. Tầng giao vận của MPEG-2 cho phép tạo ra môi trường không lỗi trong quá trình truyền. • Với SDTV, tốc độ dữ liệu từ 3 đến 10 Mbps. Với HDTV, tốc độ dữ liệu thường là 20 Mbps.
- Đặc điểm của Ứng dụng video Giao thức Chuẩn nén Tốc độ Ứng dụng và chuẩn Đặc điểm về lỗi trộn dữ liệu video bit 64-384 ISDN Video Phone (H.320) H.221 H.261 và H.263 Không có lỗi Kbps PSTN Video Phone (H.324) H.223 H.263 20 Kbps Rất thấp BER = 10-5-10-3 Mobile Video Phone 10-300 H.223 H.263 Thi thoảng mất (H.324 wireless) Kbps gói tin H.261 Video Phone qua mạng H.225/RTP/ 10-1000 BER = 0, Tỷ lệ H.262 chuyển mạch gói (H.323) UDP/IP Kbps mất gói tin 0-30% H.263 Hệ thống Gần như không Satellite TV MPEG-2 6-12 Mbps MPEG-2 có lỗi Hội nghị truyền hình qua Gần như không H.222 H.262 1-12 Mbps ATM (H.320, H.321) có lỗi H.262 tương đương MPEG-2, H.222 tương đương hệ thống MPEG-2
- CHẤT LƯỢNG DỊCH VỤ Trần Quang Đức
- Phân loại Chất lượng dịch vụ Conversation Voice/Video Streaming Audio Error Fax Voice and Video Messaging and Video Tolerant (BER > 10s) ITU-T G.1010 Standard
- Yêu cầu về Hiệu năng (Các dịch vụ thoại) Performance Parameters Degree of Data Media Application Symmetry Rate One-way Delay Information Delay Variation Loss < 150 ms Conversation 4-25 Audio Two-way preferred < 1 ms < 3% FER Voice Kbps < 400 ms < 150 ms preferred 32-384 Video Video Phone Two-way < 400 ms < 1% FER Kbps Lip synch. < 100 ms Interactive Data Two-way < 250 ms N/A Zero Games Data Telnet Two-way < 250 ms N/A Zero
- Thoại với âm thanh • Yêu cầu về độ trễ trong khoảng từ 0 đến 150 ms (dưới 30 ms người dùng không cảm nhận được độ trễ). • Có 3 hệ thống vệ tinh: LEO, MEO, and GEO. Đối LEO và MEO, độ trễ trong quá trình truyền tín hiệu dao động từ 10 ms đến 250 ms . Hệ thống GEO không thể đảm bảo được độ trễ dưới 250 ms . • Tai người chỉ có thể chấp nhận độ biến thiên về độ trễ (jitter) rất nhỏ. Do đó độ biến thiên về độ trễ phải đảm bảo dưới 1 ms.
- Thoại với Video • Video Phone yêu cầu hệ thống song công toàn phần, truyền được cả video và audio. Yêu cầu về độ trễ cũng tương tự như với thoại chỉ với âm thanh. Ngoài ra ứng dụng dạng này còn có thêm yêu cầu về đồng bộ hóa dữ liệu âm thanh và hình ảnh ‘lip-synch’. • Mắt người chấp nhận một vài thông tin bị mất, vì thế tỷ lệ mất gói tin ở mức thấp là chấp nhận được.
- Yêu cầu về Hiệu năng (Các dịch vụ tương tác) Performance Parameters Degree of Data Media Application Symmetry Rate One-way Delay Information Delay Variation Loss < 1 s Voice Primarily 4-13 Audio playback < 1 ms < 3% FER Messaging One-way Kbps < 2 s record < 0.5 s/page Web-browsing Primarily Data preferred N/A Zero HTML One-way < 4 s/page Transaction Data Two-way < 4 s N/A Zero services Email (Server Primarily Data < 4 ms N/A Zero Access) One-way
- Yêu cầu về Hiệu năng (Các dịch vụ truyền dòng) Performance Parameters Degree of Data Media Application Symmetry Rate One-way Delay Information Delay Variation Loss Primarily 5-128 < 1% Packet Audio Speech, Music < 10 s < 2 s One-way Kbps Loss Ratio Movie clips, Primarily 1-12 < 2% Packet Video Real-time < 10 s < 2s One-way Mbps Loss Ratio video Primarily < 384 Data Data Transfer < 10 s N/A Zero One-way Kbps Primarily Data Still image < 10 s N/A Zero One-way
- Hàng đợi • First In First Out (FIFO) ▫ Sử dụng một hàng đợi duy nhất, gói tin đến trước được truyền trước. Vì vậy, những gói tin có quyền ưu tiên cao có thể bị kẹt trong hàng đợi. ▫ Những dòng dữ liệu lớn sẽ có ưu thế do chiếm nhiều không gian của hàng đợi. • Priority Scheduling ▫ Độ trễ, biến thiên độ trễ và tỷ lệ mất gói tin sẽ giảm với những dòng dữ liệu có quyền ưu tiên lớn hơn. ▫ Tham số được gán cho những dòng dữ liệu để xác định mức độ ưu tiên tương ứng.
- Hàng đợi (Tiếp) • Weighted Fair Queuing (WFQ) ▫ Tất cả các dòng dữ liệu được phân loại thành một vài lớp. Một lớp có thể gồm một dòng hoặc nhiều kiểu dòng nhưng giống nhau về yêu cầu đối với đường truyền. ▫ Trong cùng một lớp, băng thông được chia sẽ tỷ lệ với nhu cầu riêng của từng dòng. • Round Robin ▫ Bộ nhớ đệm được tổ chức thành nhiều hàng đợi FIFO, mỗi hàng đợi cho một dòng dữ liệu và gói tin của từng dòng sẽ được truyền đi theo thứ tự xoay vòng.
- Kiểm soát tắc nghẽn • Tail Drop ▫ Phương pháp này bỏ tất cả các gói tin đến trong trường hợp tràn bộ nhớ đệm của hàng đợi. Nó có thể làm giảm đáng kể hiệu năng của mạng do hiện tượng đồng bộ toàn cục TCP. • Random Early Discard (RED) ▫ RED công bằng hơn so với Tail Drop. Sắc xuất bỏ gói tin sẽ tỷ lệ thuận với tốc độ dữ liệu của dòng truyền. Cụ thể, dòng truyền càng lớn thì có tỷ lệ gói tin bị bỏ càng cao. • Weighted Random Early Discard (WRED) ▫ Một phương pháp hiệu chỉnh của RED, nhưng có đánh trọng số với những dòng truyền trong RED. • Tri-Color Marking
- Best-Effort • Best-effort không đảm bảo chất lượng dịch vụ do không gán thứ tự cho các gói tin. • Băng thông cung cấp cho người dùng và thời gian truyền gói tin đều phụ thuộc vào tình trạng hiện tại của mạng. • Mạng internet dựa trên dịch vụ best-effort vì thế gói tin truyền trong mạng internet dễ bị mất, lỗi và có độ trễ cao.
- Integrated Services • Integrated Services (IntServ) cho phép được đặt trước băng thông. Tuy nhiên, dịch vụ này phải tích hợp trên tất cả các thiết bị router nằm trên đường truyền của gói tin. • Mỗi ứng dụng có thể đặt trước tài nguyên thông qua giao thức Resource Reservation Protocol (RSVP). • Khi băng thông được đặt trước cho một ứng dụng, nó không thể bị chia sẻ cho những ứng dụng khác.
- Integrated Services (Tiếp) • Những router nằm giữa thiết bị nhận và gửi phải xác định xem chúng có sẵn sàng đáp ứng những đòi hỏi về băng thông của ứng dụng. • Việc đặt trước đường đi cho gói tin là không thể trong những mạng như Internet. • Nhược điểm của IntServ là thiếu tính mở rộng (router phải tự phân loại, sắp xếp và theo dõi dòng dữ liệu). Hơn nữa, rất nhiều kết nối Internet chỉ tồn tại trong thời gian ngắn, vì thế, không nhất thiết phải đặt kênh riêng.
- Hoạt động của IntServ • Thiết bị nhận và gửi phải cung cấp cho mạng thông tin về yêu cầu của dòng dữ liệu, được gọi là Flow Specs. Flow Specs bao gồm Traffic Specification (TSPEC) và Request Specification (RSPEC). • TSPEC miêu tả những đặc tính riêng của dòng dữ liệu. RSPEC mô tả yêu cầu về dịch vụ (yêu cầu về độ trễ, yêu cầu về tốc độ truyền).
- Hoạt động của Inserv (Tiếp) • Admission Control yêu cầu mạng phải cung cấp một số dịch vụ cụ thể. Quyết định đưa ra có thể dựa trên quá trình học, ví dụ, lần trước tôi cho dòng truyền với đúng yêu cầu từ TSPEC, nhưng độ trễ vượt quá ngưỡng chấp nhận được, vì thế lần này tôi sẽ nói không. • Với admission control, bộ lọc Token Bucket Filter chỉ cho phép những gói tin đi qua với tốc độ thường không vượt quá ngưỡng cho phép, nhưng với những dòng dữ liệu nhỏ, tốc độ có thể cao hơn giá trị ngưỡng.
- Hoạt động của Inserv (Tiếp) • Ứng dụng và mạng phải trao đổi thông tin dịch vụ yêu cầu và đặc tính dòng truyền bằng cách sử dụng giao thức Resource Reservation Protocol (RSVP). • Mỗi gói tin đều được gán vào một lớp dịch vụ. Lớp dịch vụ xác định cách thức xử lý gói tin trong hàng đợi. Thông thường Weighted Fair Queuing (WFQ) được sử dụng để đảm bảo về độ trễ giữa thiết bị đầu và thiết bị cuối.
- Trạng thái mềm • Trạng thái của các phiên gồm Path state, reservation state đều có giá trị trong khoảng thời gian nhất định. Hết thời gian, trạng thái sẽ mất. • Thiết bị gửi và nhận định kỳ làm mới trạng thái, bằng cách gửi bản tin PATH/RESV và khởi động lại đồng hồ. • Trạng thái có thể bị xóa bởi bản tin Teardown. • Trạng thái mềm cho phép nâng cao hiệu năng và tăng thêm khả năng thích ứng của mạng.
- RSVP • RSVP cho phép ứng dụng chạy trên máy khách có thể đặt trước tài nguyên cho dòng dữ liệu trên mạng Internet. • RSVP phải được tích hợp vào thiết bị gửi, nhận và các router. • RSVP cho phép đặt trước băng thông theo dạng cây quảng bá (multicast tree). Thiết bị nhận khởi tạo và quản lý tài nguyên của dòng dữ liệu. • RSVP không phải là giao thức định tuyến, RSVP là dạng của giao thức bắt tay.
- Hoạt động của RSVP • Thiết bị gửi gửi bản tin PATH đến các router để tìm đường đi cho bản tin RESV. Bản tin PATH chứa TSPEC và các đặc điểm về dòng dữ liệu (băng thông tối đa, kích thước của token bucket và kích thước lớn nhất của gói tin). • Thiết bị nhận đặt trước tài nguyên bằng bản tin RESV. Có ba kiểu đặt trước tài nguyên gồm Fixed-filter, Wildcard-filter và Shared-explicit.
- Hoạt động của RSVP (Tiếp) • Kiểu fixed-filter ▫ Định nghĩa danh sách thiết bị gửi. Mỗi thiết bị gửi sẽ phải tự đặt trước tài nguyên, và tài nguyên này không thể chia sẻ với các thiết bị gửi khác. • Kiểu wildcard-filter ▫ Thiết bị nhận muốn nhận từ tất cả các thiết bị gửi, và tài nguyên đặt trước được chia sẻ giữa những thiết bị này. • Kiểu shared-explicit ▫ Định nghĩa một danh sách các thiết bị gửi. Tài nguyên đặt trước được chia sẻ chỉ giữa các thiết bị gửi trong danh sách.
- Differential Services • DiffServ không yêu cầu các nút mạng phải nhớ trạng thái của dòng dữ liệu. Nhớ trạng thái và đặt trước tài nguyên rất khó thực hiện trong mạng Internet. • Differential Services là dịch vụ nâng cao của best-effort bằng cách phân loại các dòng dữ liệu khác nhau. • DiffServ giảm đỗ trễ cho dòng video và audio, trong khi cung cấp dịch vụ best-effort để truyền tệp tin. Nó cũng bỏ những gói tin có độ ưu tiên thấp nếu xảy ra tắc nghẽn.
- Cấu trúc của DiffServ • DiffServ Policy định nghĩa dịch vụ cho một kiểu dòng dữ liệu. Nó đánh dấu IN với những gói tin phù hợp với dịch vụ đã định nghĩa và OUT với gói tin không phù hợp. Những gói tin không phù hợp sẽ bị bỏ nếu xảy ra tắc nghẽn. • Edge Router phân loại dòng dữ liệu theo những chính sách đã định nghĩa, nó cũng gán cho gói tin mã của dịch vụ tương ứng. • Core Router phân loại gói tin dựa vào mã và bảng Per-Hop- Behavior (PHB).
- Per-Hop-Behavior • PHB định nghĩa sự khác biệt về hiệu năng giữa các lớp dịch vụ, ví dụ như gói tin A có đặc quyền so với gói tin B. • PHBs có thể là: ▫ Expedited Forwarding (EF) có đặc tính như độ trễ, sai khác độ trễ, tỷ lệ mất mát gói tin thấp. Dòng dữ liệu với dịch vụ EF có mức độ ưu tiên cao nhất, nhưng chỉ được sử dụng tối đa 30% khả năng của đường truyền. ▫ Assured Forwarding (AF) định nghĩa bốn lớp dịch vụ khác với mức độ ưu tiên khác nhau. Hàng đợi và cách thức bỏ gói tin dựa trên WFQ, và RED.
- ĐỒNG BỘ DỮ LIỆU Trần Quang Đức
- Các giao thức truyền thông Synchronization Service Media encaps DASH (H.264, MPEG-4) SIP RTSP RSVP RTCP HTTP RTP TCP DCCP UDP IP Version 4, IP Version 6 AAL3/4 AAL5 MPLS ATM/Fiber Optics Ethernet/WIFI
- Vấn đề đồng bộ dữ liệu • Quan hệ nội dung ▫ Định nghĩa mối quan hệ của các đối tượng trong cùng một dữ liệu. Ví dụ, quan hệ giữa các cách thức khác nhau để biểu diễn cùng kiểu dữ liệu. • Quan hệ không gian ▫ Định nghĩa không gian để hiển thị một loại đối tượng đa phương tiện. • Quan hệ thời gian ▫ Định nghĩa quan hệ phụ thuộc thời gian giữa các đối tượng đa phương tiện. Ví dụ, mối quan hệ giữa âm thanh và hình ảnh của cùng một video.
- Đồng bộ trong và liên đối tượng • Đồng bộ trong đối tượng ▫ Định nghĩa quan hệ thời gian giữa các phần tử của cùng một đối tượng. Ví dụ như quan hệ giữa các khung hình trong một video. Giả sử video có tốc độ 25 khung hình/s, mỗi khung hình sẽ được hiển thị trong 40 ms. • Đồng bộ liên đối tượng ▫ Định nghĩa mối quan hệ thời gian giữa các đối tượng. Ví dụ đồng bộ giữa các đối tượng đa phương tiện bắt đầu bằng một video, tiếp theo là một vài hình ảnh và hoạt họa có đính kèm phụ đề.
- Đồng bộ tự nhiên và nhân tạo • Đồng bộ tự nhiên ▫ Mục đích của quá trình đồng bộ là tái hiện lại mối quan hệ thời gian giữa các đối tượng trong quá trình thu nhận. Ví dụ hội thoại truyền hình thảo luận giữa các nhóm, cần quan tâm vấn đề đồng bộ môi giữa âm thanh và hình ảnh. • Đồng bộ nhân tạo ▫ Mối quan hệ thời gian giữa các đối tượng được tạo ra. Ví dụ, 4 bản tin âm thanh được thu nhận như một phần của phim hoạt hình. Mối quan hệ về thời gian giữa hình ảnh và 4 bản tin trên cần phải được miên tả cụ thể.
- Yêu cầu về trình chiếu • Đồng bộ môi ▫ Định nghĩa mối quan hệ giữa âm thanh và hình ảnh khi một người đang nói chuyện. Vùng “in sync” nằm trong khoảng +/-80 ms. Vùng “out of sync” nằm trong khoảng +/-160 ms. • Đồng bộ chuột ▫ Người trình bày dùng chuột để miêu tả và thảo luận một đối tượng. Vùng “in sync” nằm trong khoảng +750/-500 ms. Vùng “out of sync” nằm trong khoảng +1250/-1000 ms.
- Mô hình tham chiếu Mô hình của Gerold Blakowski và Ralf Multimedia Application Steinmetz, “A Media Synchronization Survey: Reference Model, Specification, and Case Studies, ” IEEE Journal on High Selected Areas in Communications, vol. Specification Layer 14, no. 1, Jan. 1996. Object Layer Stream Layer Abstraction Media Layer Low • Mỗi lớp thực hiện một tiến trình đồng bộ hóa và cung cấp một giao diện giao tiếp để người dùng có thể định nghĩa yêu cầu riêng. Giao diện giao tiếp được sử dụng bởi ứng dụng hoặc bởi lớp nằm kế phía trên.
- Media Layer • Cho phép truy cập đến các phần tử dữ liệu (Local Data Units) thuộc một dòng dữ liệu liên tục. • Ví dụ, từng phần tử dữ liệu của một bộ phim được đọc viết và xử lý riêng biệt. Việc gán phụ đề cũng dựa trên đối sánh nhãn thời gian của phần tử dữ liệu. • Read(devicehandle, LDU) • Write(devicehandle, LDU)
- Stream Layer • Xử lý và đồng bộ hóa trong dòng dữ liệu liên tục hoặc một nhóm dòng dữ liệu. • Đặt trước tài nguyên, thiết lập tiến trình xử lý các LDU. • Start(stream), stop(stream) • Create_group(list_of_streams) • Start(group), stop(group) • Setcuepoint(stream/group, at, event)
- Object Layer • Hoạt động trên tất cả các dữ liệu đa phương tiện, kể cả dữ liệu phụ thuộc và không phụ thuộc và thời gian. • Lấy các thông tin đồng bộ dữ liệu ở tầng trên, lên kế hoạch và khởi tạo trình diễn của tất cả đối tượng của dữ liệu đa phương tiện. • Cung cấp một sản phẩm trình diễn hoàn chỉnh, đảm bảo chất lượng phù hợp với kiểu dữ liệu (độ trễ, biến thiên độ trễ).
- Specification Layer • Đây là tầng mở, bao gồm cả ứng dụng và công cụ để tạo ra đồng bộ dữ liệu. • Ví dụ, hệ thống MODE tạo giao diện đồ họa cho phép (1) chọn đối tượng video, phụ đề, thời điểm thích hợp để phụ đề được hiển thị, (2) định nghĩa mối quan hệ thời gian giữa các thời điểm hiển thị, và (3) lưu trữ thông tin đồng bộ.
- Cách thức miên tả đồng bộ dữ liệu • Đồng bộ dữ liệu miêu tả mối quan hệ thời gian giữa các đối tượng đa phương tiện. Nó bao gồm cả đồng bộ trong đối tượng và liên đối tượng và chất lượng dịch vụ của quá trình đồng bộ dữ liệu. • Với trường hợp đồng bộ trực tiếp, mối quan hệ thời gian được định nghĩa khi thu nhận đối tượng. Yêu cầu về chất lượng dịch vụ cũng được định nghĩa khi bắt đầu thu nhận • Với đồng bộ nhận tạo, thông tin đồng bộ được tạo ngoại tuyến.
- Cách thức miên tả đồng bộ dữ liệu Interaction A A B δ1 Audio P1 Animation B Video Audio Interval-Based Specification Axes-Based Specification P1 Audio Video Interaction Start a presentation Stop a presentation Animation Audio Prepare a presentation Control Flow-Based Specification Event-Based Specification
- Môi trường phân tán • Đồng bộ trong môi trường phân tán thường phức tạp hơn trong môi trường nội bộ. Nguyên nhân là do thông tin đồng bộ, ví trí của thiết bị nguồn và đích bị phân tán. Trong một vài trường hợp, ngay cả các đối tượng được trình diễn cũng nằm ở những nơi khác nhau. • Quá trình truyền dữ liệu từ nơi lưu trữ đến nơi trình chiếu làm tăng thêm độ trễ và biến thiên độ trễ. • Thông thường, đồng bộ hóa được thực hiện trên thiết bị của nhiều hãng khác nhau.
- Gửi thông tin đồng bộ dữ liệu • Gửi thông tin đồng bộ trước khi bắt đầu trình chiếu. • Gửi thông tin đồng bộ qua kênh riêng. ▫ +: Không có độ trễ ▫ -: Lỗi nếu mất gói tin đồng bộ ▫ -: Khó xử lý nếu có nhiều nút nguồn • Gửi dòng dữ liệu hỗn hợp ▫ +: Không có độ trễ, không cần kênh riêng ▫ +: Chuẩn MPEG kết hợp video, audio và thông tin đồng bộ ▫ -: Khó lựa chọn chất lượng dịch vụ thích hợp ▫ -: Khó xử lý nếu có nhiều nút nguồn
- Địa điểm thực hiện Đồng bộ dữ liệu Source Bandwidth demand Sink Đồng bộ dữ liệu tại nút đích Source Bandwidth demand Sink Đồng bộ dữ liệu tại nút nguồn
- Đồng bộ dữ liệu bằng đồng hồ Ta=Tav-Nla-Oa Source A Audio Tv=Tav-Nlv-Ov Nla Ta, Oa Oa và Ov không biết trước Sink AV Tav Source V Video Nlv Tv, Ov • Sử dụng bộ nhớ đệm có thể đảm bảo việc thu thập đầy đủ dữ liệu cho quá trình đồng bộ. • Kích thước bộ nhớ đệm là hữu hạn. Vì vậy cần ước lượng được max(Oa, Ov). Network Time Protocol cho phép đồng bộ đồng hồ với độ sai khác trong khoảng 10 ms.
- Các bước của Đồng bộ dữ liệu 1) Đồng bộ trong quá trình thu nhận đối tượng. 2) Đồng bộ trong quá trình khai thác thông tin. 3) Đồng bộ trong quá trình truyền LDU đến mạng. 4) Đồng bộ trong quá trình truyền. 5) Đồng bộ ở thiết bị nguồn. 6) Đồng bộ trong quá trình trình chiếu.
- RTP, RTCP & RTSP Trần Quang Đức
- Dòng dữ liệu đa phương tiện The production, transmission, The production, transmission, and use of data take place at and use of data take place at the same time different times Real-time Real-time Multimedia Traffic Multimedia Traffic Traffic Streaming Live A/V (Broadcast TV/radio via Internet) Can not pause, rewind. The time between Streaming Stored A/V request and display is from 1 to 10 (Like VoD) seconds. May pause, rewind The time between Real-Time Interactive A/V request and display is from 1 to 10 (IP Phone, Video conferencing) seconds. Can not pause, rewind. The time between request and display is small (video<150 ms and audio<400 ms)
- Truyền dòng thời gian thực Server Client Server Client Jitter: thời gian giữa hai gói tin nhận được Chú ý: Đỗ trễ thay đổi 0s 0s 1s 1s 10s 10s 7s 11s 20s 20s 21s 15s 30s 30s 31s 27s 37s • Sử dụng nhãn thời gian có thể giải quyết vấn đề biến thiên độ trễ. Mỗi gói tin có thời gian tương đối so với gói tin đầu tiên. • Thời điểm phát lại bị trễ 7s sau khi nhận được gói tin đầu tiên. • Bộ nhớ đệm được sử dụng để giải quyết vấn đề độ trễ.
- Thời điểm phát lại • D = ED + β EV Trong đó ▫ D: Thời điểm phát lại ▫ ED: Độ trễ trung bình dựa trên ước lượng ▫ EV: Biên thiên độ trễ trung bình dựa trên ước lượng ▫ β: Hệ số an toàn (β=4) • EDi = α EDi-1 + (1 - α) (ri - ti) • EVi = α EDi-1 + (1 - α) (ri - ti - EDi) Trong đó ▫ α: Trọng số (α=0.998) ▫ ri : Thời gian nhận gói tin i ▫ ti : Nhãn thời gian của gói tin i
- Sử dụng TCP để truyền dữ liệu? • TCP yêu cầu ứng dụng ở thiết bị đích phải đợi cho đến khi nhận được được gói tin được truyền lại do bị mất hoặc có độ trễ lớn. • TCP không hỗ trợ truyền quảng bá trong khi truyền quảng bá là yêu cầu cơ bản của dịch vụ hội nghị truyền hình. • Cơ chế quản lý tắc nghẽn của TCP giảm kích thước cửa sổ quản lý tắc nghẽn khi gói tin bị mất, trong khi ứng dụng video và audio yêu cầu đường truyền ổn định.
- Sử dụng TCP để truyền dữ liệu? • Tiêu đề của TCP lớn hơn của UDP. • Gói tin TCP không chứa nhãn thời gian để hỗ trợ cho quá trình đồng bộ hóa. • TCP không cho phép mất gói tin, trong khi với các ứng dụng audio và video tỷ lệ mất gói tin từ 1% đến 20% là chấp nhận được. Gói tin bị mất có thể phục hồi lại thông qua FEC.
- Các giao thức truyền thông Synchronization Service Media encaps DASH (H.264, MPEG-4) SIP RTSP RSVP RTCP HTTP RTP TCP DCCP UDP IP Version 4, IP Version 6 AAL3/4 AAL5 MPLS ATM/Fiber Optics Ethernet/WIFI
- Real-Time Transport Protocol • RTP là chuẩn dùng để truyền audio và video trong mạng IP. RTP được sử dụng kết hợp với Real-Time Control Protocol (RTCP). Trong khi RTP truyền dữ liệu, RTCP theo dõi quá trình truyền, chất lượng dịch vụ và thực hiện đồng bộ thời gian nhóm dòng dữ liệu. • RTP không đảm bảo truyền thời gian thực, nhưng nó cung cấp các khả năng ▫ Loại bỏ, giảm biến thiên độ trễ bằng cách dùng bộ nhớ đệm. ▫ Đồng bộ thời gian nhóm dòng audio và video. ▫ Kết hợp dòng audio và video. ▫ Chuyển đổi dòng audio và video.
- Real-Time Transport Protocol Version Padding Bit Marker bit (1 – The Incremented for each Number (2) (1 – Packet frame boundary is RTP packets (it is used contains marked) to indicate packet loss padding) and packet sequence) Contr. Ver. P X M Payload Type Sequence Number Count Timestamp ID of the source that is Synchronization Source Identifier generating the RTP Extension bit (1- packets Fixed header is Contributor Identifier followed by an It is used by a mixer to extension header) identify the contributing Contributor Identifier sources UDP RTP Pad RTP Payload Padding Header Header Count
- Nhãn thời gian và Số thứ tự • Audio ▫ Gói tin RTP có 20 ms mẫu audio. Tốc độ xung của nhãn thời gian cho audio là 8000 Hz. Vì vậy, nhãn thời gian của mỗi gói tin tăng thêm 160. ▫ Phần dữ liệu của gói tin audio chưa nén 160x8=1280. Với audio nén, kích thước dữ liệu có thể giảm đi 8 lần. • Video ▫ Gói tin RTP có một khung hình video. Tốc độ gói tin RTP là 25 hoặc 30 Hz. Tốc độ xung của nhãn thời gian cho video thường là 90,000 Hz. Vì vậy, nhãn thời gian của mỗi gói tin RTP tăng thêm 3600 hoặc 3000. ▫ Phần dữ liệu của gói tin video chưa nén 352x240x12 = 10000. Với video nén, kích thước dữ liệu có thể giảm đi 20 lần.
- Tốc độ xung của nhãn thời gian Clock Frame Packet Name Type Description References rate (Hz) size (ms) size (ms) PCMU Audio 8000 any 20 ITU-T G.711 PCM RFC 3551 GSM Audio 8000 20 20 European GSM 13 kbps RFC 3551 G722 Audio 8000 any 20 ITU-T G.722 64 kbps RFC 3551 L16 Audio 44100 any 20 Linear PCM 16 bit stereo RFC 3551 G729 Audio 8000 10 20 G.729, G.729a 8 kbps RFC 3551 raw Video 90000 Uncompressed video RFC 4175 RFC 3551 H.263 Video 90000 H.263, 1st-3rd version RFC 4629 RFC 2190 RFC 3984 H.264 Video 90000 H.264 AVC, H.264 SVC RFC 6190 JPEG Video 90000 JPEG2000 video RFC 5371
- Real-Time Control Protocol • RTCP cung cấp số liệu thống kê (ví dụ, tỷ lệ mất gói tin, biến thiên độ trễ, thời gian trễ quay vòng) và thông tin điều khiển cho phiên RTP. • Chức năng của RTCP bao gồm: ▫ Thu thập số liệu thống kê về quá trình phân phát dữ liệu đa phương tiện và gửi thông tin đó đến thiết bị nguồn hoặc các thiết bị khác tham gia vào phiên làm việc. ▫ Cung cấp các hàm điều khiển, liên kết với tất cả thành phần tham gia vào phiên làm việc.
- Real-Time Control Protocol (Tiếp) UDP RTCP Packet RTCP Packet RTCP Packet Header RTCP RTCP Data Header Version P RR Count Packet Type Message Length Padding bit 200: SR (Sender Report) 201: RR (Receiver Report) Number of Reception 202: SDES (Source Destination) Report Blocks, contained 203: BYE in the packet 204: APP (Application Specific Message) 207: XR (RTCP Extension)
- Real-Time Control Protocol (Tiếp) • Sender Report (SR) ▫ Được gửi bởi thiết bị nguồn, chứa các số liệu thống kê về quá trình truyền. Báo cáo này có gắn nhãn thời gian tuyệt đối, cho phép đồng bộ các bản tin RTP ở thiết bị nhận (Chú ý: dòng dữ liệu video và audio sử dụng nhãn thời gian riêng). • Source Description (SDES) ▫ Gửi thông tin CNAME đến các thành phần tham gia phiên làm việc, bao gồm cả những thông tin như tên, địa chỉ e- mail, số điện thoại của người sở hữu dữ liệu.
- Real-Time Control Protocol (Tiếp) • Receiver Report (RR) ▫ Báo hiệu cho thiết bị gửi và nhận về chất lượng dịch vụ. • Goodbye (BYE) ▫ Thiết bị gửi gửi bản tin BYE để kết thúc quá trình truyền dòng. Các thiết bị đầu cuối khác cũng sử dụng bản tin này nếu muốn kết thúc phiên làm việc. • Application Specific Message (APP) ▫ Bản tin mở rộng dành riêng cho các ứng dụng.
- Real-Time Control Protocol (Tiếp) • Dòng dữ liệu RTCP có thể có kích thước lớn hơn dòng dữ liệu RTP trong một phiên hội nghị với nhiều thành phần tham gia. Nguyên nhân là do gói tin RTCP được gửi cho các thành phần kể cả có tham gia thảo luận hay không. • Dòng dữ liệu RTCP có thể thay đổi kích thước tùy theo số lượng thành phần tham gia phiên làm việc. Thường nó được chọn không vượt quá 5% kích thước dòng dữ liệu RTP (1.25% dành cho thiết bị gửi, và 3.75% dành cho thiết bị nhận). Nếu số lượng thiết bị nhận tăng, tần suất gửi gói tin RTCP sẽ giảm.
- Forward Error Correction D1 D2 D3 . DN-1 P1 FEC P1 = XOR(D1, D2,D3, ,DN-1) P1 được gọi là gói tin Parity D3 = XOR(D1, D2, ,DN-1,P1) D1 D2 . Dk P1 P2 . PN-k Các gói tin Parity cho phép khôi phục N-k từ N gói tin dữ liệu bị mất (Reed Solomon Erasure Code). FEC làm tăng băng thông và độ trễ.
- Interleaving 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Các gói tin RTP mang theo 20 ms mẫu âm thanh 1 5 9 13 2 6 10 14 3 7 11 15 4 8 12 16 1 2 4 5 6 8 9 10 12 13 14 16 Gói tin bị mất chứa 5 ms mẫu âm thanh, không ảnh hưởng đến cảm nhận của tai người. Interleaving không làm tăng băng thông nhưng tăng độ trễ.
- Receiver-Based Repair 1 2 3 4 1 2 3 4 Receiver-Based Repair không làm tăng băng thông và độ trễ. Nó hoạt động dựa trên giả thiết những gói tin âm thanh gần nhau có tính tương quan cao hay sự khác biệt nhỏ. Quá trình phục hồi gói tin có thể thực hiện dựa trên phép nội suy, làm tăng độ phức tạp của tính toán.
- Real-Time Streaming Protocol • RTSP là giao thức mạng (địa chỉ cổng 554), được thiết kế để cho các máy chủ truyền dòng. Nó được sử dụng để tạo ra và điều khiển phiên truyền dữ liệu giữa các thiết bị đầu cuối. Phần lớn máy chủ RTSP đều sử dụng RTP và RTCP. • RTSP được tích hợp trong QuickTime Streaming Server, Windows Media Server, RealNetworks’s Helix, thậm chí Skype và Spotify.
- Real-Time Streaming Protocol (Tiếp) Control Request Description SETUP Yêu cầu máy chủ cấp tài nguyên để truyền dòng và bắt đầu phiên RTSP. PLAY Bắt đầu truyền dữ liệu trên dòng đã yêu cầu. RECORD Khởi tạo sao lưu dữ liệu. PAUSE Tạm ngừng nhưng không giải phóng tài nguyên. TEARDOWN Giải phóng tài nguyên liên quan đến dòng đã yêu cầu. ANNOUNCE Thay đổi thông tin mô tả đối tượng. REDIRECT Yêu cầu máy khách kết nối với máy chủ khác. SET_PARAMETER Đặt tham số phục vụ quá trình trình chiếu. DESCRIBE Lấy thông tin mô tả đối tượng.
- Real-Time Streaming Protocol (Tiếp) HTTP Get 1) Máy chủ HTTP Server Web Web lưu nội dung. Máy chủ Browser Server truyền dòng và lưu trữ Presentation Description File lưu các tệp video và SETUP audio. 2) Hai máy chủ có thể PLAY cùng chạy trên một hệ thống hoặc hai hệ Media Media Stream Media thống khác nhau. Player Server PAUSE 3) Media Player và máy chủ truyền dòng tương tác (bắt tay) bằng TEARDOWN RTSP.
- RTSP và HTTP • Tương tự như HTTP, RTSP định nghĩa lệnh để điều khiển việc phát lại dữ liệu đa phương tiện và sử dụng TCP để duy trì kết nối giữa các điểm. • Không như HTTP, RTSP là giao thức có trạng thái. Yêu cầu được tạo ra ở cả máy chủ truyền dòng và máy khách đa phương tiện. RTSP hỗ trợ truyền quảng bá dữ liệu đa phương tiện. • HTTP được hỗ trợ bởi tất cả các trình duyệt web, không bị chặn bởi các thiết bị tường lửa do sử dụng cổng 80.
- RTSP và HTTP (Tiếp) • HTTP đòi hỏi toàn bộ nội dung phải có ở trình duyệt trước khi trình chiếu. Vì thế HTTP cơ bản không phù hợp với ứng dụng thời gian thực. • Vấn đề trên được giải quyết bằng cách chia nhỏ nội dung thành những đoạn dữ liệu nhỏ. Apple định nghĩa đoạn dữ liệu 10s, trong khi đoạn dữ liệu do Adobe và Microsoft định nghĩa có kích thước 2s. • Do nội dung bị chia nhỏ, HTTP cũng không cần đợi phải có hết nội dung để gửi gói tin xác nhận.
- RTSP và RTMP • RTMP (Real-Time Messaging Protocol) được phát triển bởi Adobe sử dụng Flash Player . • Tương tự RTSP, RTMP là giao thức có trạng thái, máy chủ truyền dòng có thể theo dõi toàn bộ phiên làm việc từ lúc máy khác thực hiện kết nối cho đến khi kết thúc kết nối. • RTMP sử dụng cổng 1935 và có thể bị chặn bởi một số thiết bị tường lửa. RTMPE cho phép mã hóa và bảo mật dữ liệu thời gian thực.
- H.323 Trần Quang Đức
- Định nghĩa • H.323, ITU-T Recommendation, định nghĩa các thành phần, giao thức, và quy trình để cung cấp các dịch vụ truyền thông đa phương tiện, bao gồm cả truyền thời gian thực video và audio. • H.323 được sử dụng rộng rãi trong các ứng dụng truyền thời gian thực như NetMeeting. • H.323 là một phần trong chồng giao thức ITU-T H.32x, xử lý truyền thông đa phương tiện trên ISDN, PSTN và mạng 3G.
- Các thành phần của H.323 H.323 H.323 Multipoint Terminal Control Unit (MCU) H.323 H.323 H.323 H.323 Gatekeeper Gateway Terminal Terminal QoS N-ISDN B-ISDN LAN PSTN V.70 H.324 Speech H.322 Speech H.320 H.321 Terminal Terminal Terminal Terminal Terminal Terminal Terminal
- Thiết bị đầu cuối H.323 • Thiết bị đầu cuối H.323 có thể là máy tính cá nhân (PC) hoặc một thiết bị độc lập chạy H.323 và ứng dụng đa phương tiện. • Thiết bị đầu cuối H.323 hộ trợ truyền thông audio, có thể cả video và dữ liệu. Nó có thể sử dụng trong hội nghị đa điểm. • Thiết bị đầu cuối H.323 tương thích với thiết bị đầu cuối H.324 trên PSTN, H.310 trên B-ISDN, H.320 trên ISDN, H.321 trên B-ISDN và H.322 trên QoS LAN.
- H.323 Gateway • H.323 gateway kết nối hai mạng không tương đồng. Ví dụ, H.323 gateway kết nối một thiết bị đầu cuối H.323 và thiết bị khác trong mạng PSTN. • H.323 gateway cho phép chuyển đổi giao thức bắt tay, thủ tục thiết lập cuộc gọi, kết thúc cuộc gọi và thay đổi dạng dữ liệu giữa hai mạng khác nhau. • Gateway không cần thiết trong kết nối giữa hai thiết bị đầu cuối H.323.
- H.323 Gatekeeper • H.323 gatekeeper là thành phần tùy chọn trong mạng H. 323, cung cấp các dịch vụ cho thiết bị đầu cuối, gateway và MCU. • Phân giải địa chỉ là dịch vụ quan trọng nhất của H.323 gatekeeper, cho phép kết nối hai thiết bị đầu cuối và không yêu cầu thiết bị đầu cuối phải biết địa chỉ IP của thiết bị còn lại. • Giao thức RSA được sử dụng để giao tiếp giữa thiết bị đầu cuối, gateway và MCU với Gatekeeper và giữa các Gatekeeper với nhau.
- H.323 Multipoint Control Unit • H.323 MCU hỗ trợ quản lý hội nghị đa điểm. Nó gồm có hai thành phần cơ bản: Multipoint Controller (báo hiệu cuộc gọi, điều khiển phiên hội nghị) và Multipoint Processor (chuyển đổi hoặc kết hợp các dòng dữ liệu đa phương tiện). • H.323 MCU quản lý tài nguyên hội nghị, xác định audio và video CODEC để giao tiếp giữa các thiết bị đầu cuối và xử lý dòng dữ liệu. Một vài MP có thể chuyển đổi kiểu dữ liệu audio và video theo thời gian thực. • Gatekeeper, Gateway và MCU có thể tích hợp trong cùng một thiết bị vật lý.
- Các giao thức dùng trong H.323 Multimedia Applications, User Interface Terminal Control & Management Media Control Text: T.140 Video: H.26x CODEC H.225 Audio: G.711, G.729 H.225 Call H.245 RTCP G.723,G.726 RAS Signaling RTP TCP/UDP TCP UDP UDP IP
- H.225 • H.225 Call Signaling định nghĩ các thông điệp để tạo kết nối giữa hai thiết bị đầu cuối H.323, giữa các thiết bị đầu cuối và Gatekeeper. • H.225 RSA (Registration, Admission, và Status) là giao thức được dùng để đăng ký, thay đổi băng thông, trao đổi trạng thái và kết thúc liên kết giữa các thiết bị đầu cuối và gatekeeper. Kênh báo hiệu được mở trước khi mở tất cả các kênh khác.
- H.225 Call Signaling Message Description Setup Gửi bởi bên gọi H.323, xác định mong muốn thiết lập cuộc gọi. Gửi bởi bên được gọi, xác định đã nhận được đầy đủ thông tin và đường dẫn đến Call Proceeding bên gọi. Alerting Gửi bởi bên được gọi, xác định đã nhận được cuộc gọi với chuông reo Connect Gửi bởi bên được gọi, thông báo cho bên gọi đã thực hiện kết nối. Release Complete Gửi bởi bên gọi hoặc bên được gọi để kết thúc cuộc gọi. Notify Thông báo những thay đổi trong cuộc gọi. Status Inquiry Yêu cầu gửi thông báo về trạng thái cuộc gọi. Status Gửi trạng thái để trả lời yêu cầu.
- H.225 RSA Gatekeeper Discovery Registration q Gatekeeper Request (GRQ) q Registration Request (RRQ) q Gatekeeper Confirm (GCF) q Registration Confirm (RCF) q Gatekeeper Reject (GRJ) q Registration Reject (RRJ) Admission Control Unregistration q Admission Request (ARQ) q Unregistration Request (URQ) q Admission Confirm (ACF) q Unregistration Confirm (UCF) q Admission Reject (ARJ) q Unregistration Reject (URJ) Disengage Endpoint Location q Disengage Request (DRQ) q Location Request (LRQ) q Disengage Confirm (DCF) q Location Confirm (LCF) q Disengage Reject (DRJ) q Location Reject (LRJ)
- H.245 H.245 control signaling được dùng để gửi thông tin điều khiển hoạt động của H.323. Master/Slave Determination Logical Channel Signaling q Master-Slave Determination q Open Logical Channel q Master-Slave Determination Ack. q Open Logical Channel Ack. Close Logical Channel Signaling Bidirectional Logical Channel Signaling q Close Logical Channel q Open Logical Channel q Close Logical Channel Ack. q Open Logical Channel Ack. Ending a session Capabilities Exchange q End Session q Terminal Capability Set q Terminal Capability Set Ack. q Terminal Capability Set Reject
- Thủ tục cuộc gọi H.323 TER. A TER. B 1 1. Setup 2 H. 225 2. Call Proceeding 3 3. Alerting 4 4. Connect 5,6 5. Capability Exchange 6. Master-Slave Determination 7 7. Open Logical Channel 8 8. Open Logical Channel Ack. H. 245 9. Open Logical Channel 9 10. Open Logical Channel Ack. 10 (RTP/RTCP) 11. End Session 12. End Session 11 H. 245 13. Release Complete 12 13 H. 225
- Thủ tục cuộc gọi H.323 (Tiếp) TER. A GK TER. B 1 1. ARQ 2 2. ACF 3 3. Setup 4 4. ARQ 5. ACF 5 6. Alerting 6 7. Connect 8. Release Complete 7 9. DRQ H.245 10. DCF 11. DRQ (RTP/RTCP) 12. DCF 8 9 11 10 12
- Thủ tục cuộc gọi H.323 (Tiếp) TER. A GK GK TER. B 1 1. ARQ 2 2. LRQ 3 3. LCF 4 4. ACF 5. Setup 5 6. ARQ 6 7. ACF 8. Alerting 7 9. Connect 8 10. Release Complete 11. DRQ 9 12. DCF 13. DRQ 14. DCF 10 11 13 12 14
- Thủ tục cuộc gọi H.323 (Tiếp) TER. A Gateway PSTN TER. B 1 1. H.225 Setup 2 2. Q.931 Setup 3 3. Q.931 Call Proceeding 4 Ring 4. H.225 Call Proceeding 5. H.225 Alerting 5 Off-Hook 6. Q.931 Connect 6 7. H.225 Connect 7 8. Q.931 Connect Ack. H.245 9. Q.931 Disconnect 10. H.245 End Session 8 11. H.245 End Session (RTP/RTCP) TDM Stream 12. Q.931 Release 13. Q.931 Release Complete 10 9 On-Hook 14. H.225 Release Complete 11 12 14 13
- Hội nghị truyền hình H.323 TER. A With MCU TER. B 1 1. Setup 2 2. Connect 3 3. Capability Exchange 4 4. Master-Slave Determination 5. Logical Channel Establishment 5 6. Setup 7. Connect Media Exchange 8. Capability Exchange 9. Master-Slave Determination 6 10. Logical Channel Establishment 7 8 9 10 Multipoint Conference
- Session Initiation Protocol Trần Quang Đức
- Định nghĩa • Session Initiation Protocol (IETF RFC 3261) là giao thức điều khiển ở tầng ứng dụng, hỗ trợ khởi tạo, thay đổi và kết thúc một phiên dữ liệu đa phương tiện thông qua mạng chuyển mạch gói. • Chức năng của SIP bao gồm: ▫ Vị trí thiết bị đầu cuối ▫ Giao tiếp với thiết bị đầu cuối để khởi tạo cuộc gọi ▫ Trao đổi thông tin để tạo phiên làm việc ▫ Thực hiện thay đổi trong phiên làm việc hiện tại ▫ Kết thúc phiên làm việc
- Định nghĩa (Tiếp) • SIP có khả năng mở rộng cao, như mở rộng các dịch vụ gia tăng cuộc gọi, hoặc mở rộng liên kết với nhiều hệ thống khác. • Một mạng SIP bao gồm các thành phần, User Agent (UA), Gateway, Back-to-back UA, Proxy Server, Redirect Server và Registrar. Mỗi thành phần có một chức năng riêng và tham gia vào kết nối SIP như một máy khách (khởi tạo yêu cầu), hoặc máy chủ (trả lời yêu cầu), hoặc cả hai.
- SIP User Agent • UA nhận yêu cầu từ người dùng để thiết lập hoặc kết thúc phiên làm việc. Người dùng cũng có thể là một giao thức khác như gateway. UA thường được đăng ký với Proxy server nằm cùng miền xác định. • RFC 2543 định nghĩa UA là một ứng dụng gồm cả UA Client (UAC) và UA Server (UAS). UAC là ứng dụng máy khách, gửi các yêu cầu SIP. UAS là ứng dụng máy chủ, xác nhận đã nhận được yêu cầu và gửi phản hồi đến người dùng.
- SIP Server • SIP Proxy Server nhận yêu cầu từ UA hoặc một Proxy Server, chuyển tiếp hoặc trả lới yêu cầu. Nó không tạo ra yêu cầu. Proxy server có trạng thái (như forking proxy server) theo dõi tiến trình yêu cầu và phản hồi trong quá khứ. • SIP Redirect Server chấp nhận yêu cầu, tìm kiếm và gửi trả địa chỉ SIP của bên được gọi cho UA. Địa chỉ trả lại bằng 0 nếu bên gọi chưa được đăng ký. SIP Redirect Server không chuyển yêu cầu đến một máy chủ khác. • SIP Registrar Server chấp nhận yêu cầu đăng ký REGISTER, cập nhật cơ sở dữ liệu thông tin liên quan đến người dùng.
- SIP Back-to-back User Agent • B2BUA là một kiểu UA, nhưng cho phép nhận yêu cầu SIP, sửa đổi yêu cầu cho phù hợp và gửi đi như một yêu cầu mới. • B2BUA hoạt động tương tự như Proxy server. B2BUA lưu mọi trạng thái trong suốt cuộc gọi. Proxy server chỉ lưu các trạng thái lúc bắt đầu và kết thúc cuộc gọi • B2BUA có thể là một phần của một thiết bị, ví dụ PBX. Trộn và kết nối phiên hội nghị cũng sử dụng B2BUA.
- SIP Gateway • SIP gateway thực hiện kết nối mạng SIP với một mạng sử dụng các giao thức báo hiệu khác. SIP gateway là một kiểu UA đặc biệt, khi UA đóng vai trò của một giao thức khác. • SIP gateway có thể chia thành (1) media gateway (MG) quản lý giao thức điều khiển cuộc gọi, và (2) media gateway controller (MGC) quản lý tiến trình liên kết dữ liệu. • SIP gateway có thể hỗ trợ hàng trăm người dùng.
- Bản tin yêu cầu SIP Message Description INVITE Khởi tạo cuộc gọi hoặc thay đổi các tham số (re-INVITE) ACK Trả lời cuối cùng cho yêu cầu khởi tạo cuộc gọi INVITE BYE Kết thúc cuộc gọi CANCEL Hủy tìm kiếm hoặc rung chuông OPTIONS Hỏi về khả năng của phía bên kia cuộc gọi REGISTER Đăng ký với Location Service INFO Gửi thông tin giữa phiên làm việc UPDATE Thay đổi trạng thái của phiên làm việc mà không thay đổi tráng thái của cuộc thảo luận
- Bản tin trả lời SIP Class Description 1xx Informational (Xác định các trạng thái trước khi kết thúc cuộc gọi) 2xx Success (Yêu cầu đã được thực hiện thành công) 3xx Redirection (Mảy chủ trả về vị trí mới) 4xx Client error (Yêu cầu bị hỏng do lỗi phía máy khách) 5xx Server failure (Yêu cầu bị hỏng do lỗi phía máy chủ) 6xx Global failure (Yêu cầu bị hỏng, nhưng không nên thực hiện lại yêu cầu) 100 Trying 301 Move Permanently 402 Payment Required 180 Ringing 302 Move Temporarily 403 Forbidden 200 OK 400 Bad request 404 Not found 202 Accepted 401 Unauthorized 503 Service Unavailable 300 Multiple Choices 402 Payment Required 604 Does Not Exist Anywhere