Bài giảng Hệ thống điều khiển thông minh - Chương 5: Điều khiển thích nghi và điều khiển học - Huỳnh Thái Hoàng

61 trang ngocly 4150 Free

Download

Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Hệ thống điều khiển thông minh - Chương 5: Điều khiển thích nghi và điều khiển học - Huỳnh Thái Hoàng", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

bai_giang_he_thong_dieu_khien_thong_minh_chuong_5_dieu_khien.pdf

Nội dung text: Bài giảng Hệ thống điều khiển thông minh - Chương 5: Điều khiển thích nghi và điều khiển học - Huỳnh Thái Hoàng

Moân hoïc HEÄ THOÁNG ÑIEÀU KHIEÅN THOÂNG MINH Giaûng vieân: TS. Huyønh Thaùi Hoaøng BäBoä moâ n Ñi ÑiàKhiåTöÑäeàu Khieån Töï Ñoäng Khoa Ñieän – Ñieän Töû Ñaïi hoïc Baùch Khoa TP.HCM Email: hthoang@hcmut . edu. vn Homepage: 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 1
Sơ đồ khối hệ thống điều khiển thích nghi Hệ thống điều khiển trong đó thông số (à(và cấu tú)trúc) của bộ điều khiển thay đổi trong quá trình vậnhànhnhằm đảmbảochấtlượng điềukhiển khi có sự hiệndiệncủa các yếutố bất định hoặcbiến đổi không biếttrướcgọilàhệ thống điều khiển thích nghi. 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 5
Phân loại hệ thống điều khiển thích nghi Đốiti tượng: Tuyến tính hoặc phi tuyến SISO hoặc MIMO ((g,gvuông, không vuông) Hệ có bậc tương đối tổng quát Có nhiễu hệ thống, nhiễu đo lường Thông tin phản hồi: Trạng thái Ngõ ra Cơ sở của thuật toán điều khiển thích nghi: Điều khiển hồi tiếppy tuyến tính hóa Điều khiển trượt Thuật toán thích nghi: Liên tục hoặc rời rạc 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 6
Đặt bài toán Đốiti tượng: hệ phi t uyến SISO m ô tả bởihi phương ttìrình vi phâ n: ⎧x& = f (x) + g(x)u ⎨ ⎩y = h(x) Bài toán đặtralàt ra là điều khi ển tín hi ệuura ra y(t) bám theo tín hi ệu đặt ym(t) 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 7
Đối tượng điều khiển Nếu đốiti tượng cóób bậc tương đốiib bằng r, đốiti tượng cóthó thể được môtô tả bằng phương trình sau: y (r) = a(x) + b(x)u r Trong đó: a(x) = L f h(x) r−1 b(x) = Lg L f h(x) ≠ 0 với: ∂φ(x) ⎡∂φ(x) ∂φ(x)⎤ T L f φ(x) = . f (x) = ⎢ ,K, ⎥[]f1 (x),K f n (x) ∂x ⎣ ∂x1 ∂xn ⎦ ∂Lk −1φ(x) Lk φ(x) = f . f (x) f ∂x ∂Lk φ(x) L Lk φ(x) = f .g(x) g f ∂x 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 8
Luật điều khiển hồi tiếp tuyến tính hóa Luật điều khiển hồitii tiếp tuyến tính hó a: 1 u* (x) = []− a(x) + v(t) b(x) 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 9
Tính ổn định của luật điều khiển hồi tiếp tuyến tính hóa Đặc tính động học của sai số bám: e&s +ηes = 0 1 Chọn hàm L yapunov: V = e2 2 s Dễ dàng thấy ràng: V ≥ 0 2 V& = es e&s = −ηes ≤ 0 ⇒ Hệ thống ổn định ⇒ es (t) → 0 khi t → ∞ ⇒ eo (t) → 0 khi t → ∞ ⇒ y(t) bám theo ym(t) với sai số xác lập bằng 0 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 11
Ý tưởng điều khiển thích nghi Điều khiển thích nghi trê n cơ sở xấp xỉ luật điều khiển hồiii tiếp tuyến tính hóa : 1 u* (x) = [− a(x) + v(t)] b(x) Lý do: hàm a(x) và b(x) chưa biết hoặc hàm a(x) và b(x) đã biết nhưng thay đổi trong quá trình vận hành Hai ph ương pháp điều khi ển thích nghi: Điều khiển thích nghi gián tiếp Điều khiển thích nghi trực tiếp 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 12
Điều khiển thích nghi gián tiếp Nhận dạng trực tuyến a(x) và b(x) dùng m ô hình a ˆ ( x ) và b ˆ ( x ) , sau đó tính tín hiệu điều khiển theo nguyên lý chắc chắn tương đương. 1 u (x) = [− aˆ(x) + v(t)] ce bˆ(x) Mô hình aˆ ( x ) và b ˆ ( x ) có thể là mô hình mờ, mạng thần kinh hoặc mô hình hộp đen phi tuyến tổng quát. T aˆ(x) =θ a ξ a (x) ˆ T b(x) = θb ξb (x) Các vector θ a và θ b là vector thông số của mô hình. 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 13
Điều khiển thích nghi gián tiếp (tt) Các vector thông số θ a và θ b được cập nhật trực tuyến để tiệm cận tiến tới giá trị tối ưu: * ⎧ T ⎫ θb = arg min ⎨sup θb ξb (x) − b(x) ⎬ θ ∈Ω b b ⎩x∈S x ⎭ * ⎧ T ⎫ θ a = arg min ⎨sup θ a ξ a (x) − a(x) ⎬ θ ∈Ω a a ⎩x∈S x ⎭ Gọiàlàii δ a ( x ) và δ b ( x ) là sai số giữa môôhìh hình tối ưu và đặc tíhính động học chính xác của đối tượng. Mô hình đúng của đối tượng có thể biểu diễn như sau: *T a(x) =θ a ξ a (x) + δ a (x) *T b(x) =θb ξb (x) + δ b (x) 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 14
Điều khiển thích nghi gián tiếp (tt) Sai lệch giữa mô hình nhận dạng được và mô hình đúng của hệ thống: ~T aˆ(x) − a(x) = θ a (t)ξ a (x) −δ a (x) ˆ ~T b(x) − b(x) =θb (t)ξb (x) −δ b (x) trong đó: ~ * θ a (t) = θ a (t) −θ a ~ * θb (t) =θb (t) −θb Sai số mô hình luôn tồn tại trong các ứng dụng thực tế. Để đảm bảo hệ thống ổn định sử dụng thêm thành phần điều khiển trượt usi. Tín hiệu điều khiển là tổng gồm 2 thành phần: uce điều khiển hệ thống bám quỹ đạo chuẩn usi đảm bảo hệ thống ổn định u = uce + usi 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 15
Các giả thiết cần để thiết kế bộ điều khiển thích nghi gián tiếp b(x) bị chặn: 0 < b(x) ≤ b(x) ≤ b(x) < ∞ Quỹ đạo chuẩn mong muốn y m ( t ) khả vi liên tục bị chặn đến bậc r (r) và các đạo hàm y& m ( t ) , , y m ( t ) có thể đo được. Sai số cấu trúc giữa mô hình và đặc tính chính xác của đối tượng bị chặn bởi các cận biết trước: δ a (x) ≤ δ a (x)∈L∞ δ b (x) ≤ δ b (x)∈L∞ 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 16
Trình tự thiết kế bộ điều khiển thích nghi: Viết biểu thức mô tả động học sai số bám. Chọn hàm Lyapunov V (là hàm toàn phương theo sai số bám và sai s ố thông s ố). Luật thích nghi thông số được chọn sao sai số thông số bị triệt tiêu khỏi đạo hàm theo thời gian của hàm Lyapunov ( V & không phụ thuộc vào sai số thông số của mô hình) Thành phần điều khiển chế độ trượt được chọn sao cho đảm bảo đạo hàm theo th ờigianci gian của hàm Lyapunov âm ( V & < 0 ) khi sai s ố cấu trúc nằm trong giới hạn định trước. 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 17
Thiết kế bộ điều khiển thích nghi gián tiếp Biểuthu thứccmôt mô tả động họcsaisc sai số bám ˆ e&s +ηes = (aˆ(x) − a(x)) + (b(x) − b(x))uce − b(x)usi 1 2 1 ~T ~ 1 ~T ~ Hàm Lyapunov: V = es + θ a Qaθ a + θb Qbθb 2 2 2 ⇒ 2 ~T ~T V& = −ηes − busies + es (−δa −δbuce ) +θa (Qaθ&a + ξaes ) +θb (Qbθ&b + ξbesuce ) −1 Luật thích nghi thông số: θ&a = −Qa ξ aes −1 θ&b = −Qb ξbucees 1 Thành phần điều khiển chế độ trượt: u = ()δ + δ u sgn(e ) si b a b ce s 2 ⎛ b ⎞ ⇒ V& ≤ −ηes − ⎜ −1⎟es []δ a + δ b uce ≤ 0 ⎝ b ⎠ ⇒ Hệ thống ổn định 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 18
Thí dụ: Điều khiển thích nghi gián tiếp hệ bồn kép dùng mô hình mờ Đặc tính động họccủahệ thống mô tả bởi các phương trình sau: 1 h&1(t) = (ku(t) − sgn(h1(t) − h2(t))CDa1 2g | h1(t) − h2(t) |) A1(h1) 1 h&2(t) = (sgn(h1(t) − h2(t))CDa1 2g | h1(t) − h2(t) | − CDa2 2gh2(t)) A2(h2) Amax − Amin Ai (hi ) = hi + Amin hmax 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 20
Điều khiển thích nghi trực tiếp Luật điều khiển hồiii tiếp tuyến tííhhólýnh hóa lý tưởng: 1 u*(x) = []− a(x) + v(t) b(x) Dùng mô hình phi tuyến để nhận dạng trực tiếp u*(x): T uˆ(x) =θu ξu (x) Mô hình u ˆ ( x ) có thể là mô hình mờ, mạng thần kinh hoặc mô hình hộp đen phi tuy ếnnt tổng quát . ξu (x) là vector độ đúng của mệnh đề điều kiện của mô hình mờ, vector ngõ ra lớp ẩncn củama mạng thần kinh, ho ặc vector hàm c ơ sở phi tuyến tổng quát. θu là vector thông số của mô hình. 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 21
Điều khiển thích nghi trực tiếp (tt) Vector thông số θ u được cập nhật trực tuyến để tiệm cận tiến tới giá trị tối ưu: * ⎧ T * ⎫ θu = argmin⎨sup θu ξu (x) − u ⎬ θ ∈Θ u ⎩x∈S x ⎭ Gọilàii δ u ( x ) là sai số giữa môôhìh hình tối ưu vààl luật điều khiển hồiii tiếp tuyến tính hóa lý tưởng. Luật điều khiển tuyến tính hóa có thể biểu diễn như sau: * *T u (x) = θ u ξ u (x) + δ u (x) 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 22
Điều khiển thích nghi trực tiếp (tt) SilSai lệchhi giữa luật điều khiển nhận dạng được vààl luật điều khiển hồi tiếp tuyến tính hóa: * ~T uˆ(x) − u (x) =θu ξu (x) −δ u (x) ~ * trong đó: θu (t) = θu (t) −θu Sai số mô hình luôn tồn tại trong các ứng dụng thực tế. Để đảm bảo hệ thống ổn định sử dụng thêm thành ph ần điều khi ểnntr trượt usdd. Tín hiệu điều khiển là tổng gồm 2 thành phần: û xấp xỉ luật điều khiển hồi tiếp tuyến tính hóa lý tưởng usd đảm bảo hệ thống ổn định u = uˆ + usd 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 23
Các giả thiết cần để thiết kế bộ điều khiển thích nghi trực tiếp b(x) bị chặn: 0 < b(x) ≤ b(x) ≤ b(x) < ∞ Đạo hàm theo thời gian của b(x) bị chặn bởi cận biết trước | b&(x) |≤ Db (x) Quỹ đạo chuẩn mong muốn y m ( t ) khả vi liên tục bị chặn đến bậc r (r) và các đạo hàm y& m ( t ) , , y m ( t ) có thể đo được. Sai số cấu trúc giữa luật điều khiển nhận dạng và luật điều khiển hồi tiếp tuyến tính hóa bị chặn bởi cận biết trước: δu (x) ≤ δu (x)∈L∞ 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 24
Trình tự thiết kế bộ điều khiển thích nghi: Viết biểu thức mô tả động học sai số bám. Chọn hàm Lyapunov V (là hàm toàn phương theo sai số bám và sai s ố thông s ố). Luật thích nghi thông số được chọn sao sai số thông số bị triệt tiêu khỏi đạo hàm theo thời gian của hàm Lyapunov ( V & không phụ thuộc vào sai số thông số của mô hình) Thành phần điều khiển chế độ trượt được chọn sao cho đảm bảo đạo hàm theo th ờigianci gian của hàm Lyapunov âm ( V & < 0 ) khi sai s ố cấu trúc nằm trong giới hạn định trước. 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 25
Thiết kế bộ điều khiển thích nghi trực tiếp Biểuthu thứccmôt mô tả động họcsaisc sai số bám ~T e&s +ηes = −bθ u ξu + bδ u − busd 1 1 ~ ~ Hàm Lyapunov: V = e2 + θ T Q θ 2b s 2 u u u 2 ηes ~T b& 2 ⇒ V& = − − es usd + esδu +θu (Quθ&u −ξues ) − es b 2b2 −1 Luật thích nggghi thông số: θ&u = Qu ξu es ⎛ D ⎞ u = ⎜δ + b e ⎟sgn(e ) Thành phần điều khiển chế độ trượt: sd ⎜ u 2 s ⎟ s ⎝ 2b ⎠ ηe2 ⇒ V& ≤ − s ≤ 0 b ⇒ Hệ thống ổn định 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 26
Thí dụ điều khiển thích nghi trực tiếp cánh tay máy u(t): moment tác động lêntrục quay củacáhánh tay máy φ(t): góc quay (vị trí) của cánh tay máy, J: moment quán tính của cánh tay máy (J = 0.05 kg.m2) M: khối lượng của cánh tay máy (M = 1.0kg) m:khốilượng vậtnặng (m = 0.1 kg) l:chiều dài cánh tay máy (l =0.4m) lC : khoảng cách từ trọng tâm cánh tay máy đến trục quay (lC =0.15m) B:hệ số ma sát nhớt (B = 0.2 kg.m2/s) g: gia tốc trọng trường (g = 9.81 m/s2) Phươngtrìnhviphânmôtả cánh tay máy 1 bậctự do: 2 (J + ml )φ&&(t) + Bφ&(t) + (ml + MlC )g sinφ(t) = u(t) Giả sử trong quá trình vậnhành, thông số cánh tay máy (thí dụ như trọng lượng tải) thay đổi. 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 28
Phương trình ngõ ra cánh tay máy Phương trình vi phânmôtả cánh tay máy 1 bậctự do: 2 (J + ml )φ&&(t) + Bφ&(t) + (ml + MlC )g sinφ(t) = u(t) Đặt: y(t) = φ(t) T T x(t) = [x1(t), x2 (t)] = [φ(t),φ&(t)] Phương trình ngõ ra cánh tay máy: &y& = a(x) + b(x)u − Bx (t) − (ml + Ml )g cosx (t) a(x) = 2 C 1 (J + ml 2 ) 1 b(x) = (J + ml 2 ) 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 29
Thiết kế bộ điều khiển thích nghi trực tiếp Sử dụng mạng thần kinh RBF với 9 hàm cơ sởởlớp ẩn để xấpxỉ trựctiếptín hiệu điều khiểnhồi tiếp tuyến tính hóa lý tưởng: T uˆ(x) = θu ξu (x) T θ = []θu1 θu2 K θu9 T ξu (x) = [ξu1(x) ξu2 (x) K ξu9 (x)] [(x −μ )2 +(x −μ )2 ] − 1 1i 2 2i 2 σi ξui (x) = e (σ i = 0.6) Vị trí tâm các hàm cơ sở 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 31
Khái niệm điều khiển học Hệ thống điều khiển học là hệ thống điều khiểncó khả năng cải thiệnchấtlượng điềukhiển trong tương lai, dựa vào thông tin kinh nghiệmmàhệ thống thu thập được trong quá khứ, thông qua tương tác vòng kín với đốitượng và môi trường. Đặc điểm của hệ thống điều khiển học: Hệ thống điềukhiểnhọccókhả năng tự chủ (autonomy), vì nó có thể cảithiệnchấtlượng của chính nó. Hệ thống điềukhiểnhọccóbộ nhớ vì thông tin quá khứ là yếutố then chốt để cảithiệnchấtlượng tương lai. Để cải thiệnchất lượng, hệ thống điều khiển học phhải nhận thông tin phảihồichấtlượng dựatrênmộthàmmụctiêumàhệ thống tìm cựctrị. 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 33
So sánh điều khiển học và điều khiển thích nghi Giống nhau: Cả hệ thống điều khiển thích nghi và điều khiểnhọc đềucóthể thực thi bằng cách sử dụng các thuật toán chỉnh định thông số Hai phương pháp điều khiển đềusử dụng thông tin phảnhồichất lượng thu thập được qua tương tác vòng kín với đốitượng và môi trường. Khác nhau: Khác biệt cơ bản giữa điều khiển thích nghi và điều khiển học là khả năng sử dụng thông tin kinh nghiệm trong quá khứ. Hệ thống điềukhiển thích nghi không có bộ nhớ nên phảichỉnh định lại thông số khi ngay cả khi tình huống cũ lặplại. Hệ thống điềukhiểnhọccóbộ nhớ lưutrữ các cấu trúc và thông số điều khiển đã học trong quá khứ -> không cần quá trình thích nghi khi tình huống thay đổilặplại tình huống trong quá khứ. 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 34
Thực thi hệ thống điều khiển học Tra bảng: Phân chia không gian tín hiệu vào thành các miềnrờinhausao cho tín hiệuracóthểđượcxácđịnh bằng cách "tra bảng" tương ứng vớimiền tín hiệuvào. Rất nhiềuhệ thống điều khiểnhọc đượcthựchiện theo cách này. Khuyết điểm của phương pháp này là tổ hợp các miền tín hiệu vào tăng lên khi không gian trạng thái tăng lên hoặcsố miền phân chia mỗichiều không gian trạng thái tăng lên. 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 36
Thực thi hệ thống điều khiển học Xấp xỉ hàm: Các hệ thống điềukhiểnhọccaocấphơncóthể phát triểndựa trên cấutrúctoánhọccóthể xấpxỉ mộthọ các hàm liên tục; cấu trúc này có thể cố định hay biến đổi và có nhiều thông số tự do. Thực thi hệ thống điều khiểnhọcbằng cách xấpxỉ hàm có một số ưu điểm hơn so với các tra bảng: Thứ nhất, các hàm liên tục nói chung đượcmôtả một cách hiệuquả hơn thông qua các thông số tự do, và do đó, cách xấpxỉ hàm cầnítbộ nhớ hơn để biểudiễnmột hàm liên tục so với cách tra bảng. Thứ hai, cấu trúc xấp xỉ hàm có tính chất tổng quát hóa (tức là nội suy giữanhững điểm tín hiệuvào). Các cấutrúcxấpxỉ hàm đượcsử dụng phổ biến: mạng thầnkinh (MLP,RBF)vàmôhìnhmờ (Mamdani, Takagi - Sugeno) 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 37
Thí dụ điều khiển học dùng mạng RBF Đối tượng mô tả bởi mô hình toán học: ⎧x(k +1) = A(v)x(k) + B(v)u(k) ⎨ ⎩y(k) = Cx(k) ⎡0.665v(v − 2) − 0.95⎤ A(v) = ⎢ ⎥ ⎣ 1.0 0.0 ⎦ ⎡ ⎛ e−v −1 ⎞⎤ 0.3⎜ +1.1⎟ B(v) = ⎢ ⎜ ⎟⎥ ⎢ ⎝ v ⎠⎥ ⎣⎢ 0.0 ⎦⎥ C = [1 0] Trong đó v là biếnhoạch định điểmlàmviệc, giả sử v thay đổi theo qui luậtsau: v(k +1) = 0.9v(k) + 0.1μ(k) μ(k) = rand ([0, 1]) 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 38
Thí dụ điều khiển học dùng mạng RBF (tt) Giả thiết chúng tachỉ biết bậccủa hệ thống (bậc 2) mà không biết ảnh hưởng của điểmlàmviệc đến đặctínhđộng họccủahệ thống như thế nào (tức là không biếtcụ thể A(v) và B(v) phụ thuộcvàov như thế nào) Mụctiêuđiềukhiển là bám theo tín hiệuvàovới đáp ứng quá độ cho trước. 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 39
Thí dụ điều khiển học dùng mạng RBF (tt) Sơ đồ khối hệ thống điều khiển học trực tiếp: 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 40
Thí dụ điều khiển học dùng mạng RBF (tt) 0.0025 Mô hình chuẩn: G (s) = m s + 0.8s + 0.1625 Luật điều khiểnhồitiếptrạng thái: u(k) = −K1x1(k) − K2 x2 (k) + K3r(k) K1, K2: độ lợihồitiếptrạng thái, K3: độ lợi đầuvào 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 41
Thí dụ điều khiển học dùng mạng RBF (tt) Mục đích củaHTĐKhọclànhậndạng và lưutrữ vector thông số củabộ điều khiểnnhư là hàm củabiếnhoạch định điểmlàmviệc. Mạng RBF: 1 ngõ vào v, 3 ngõ ra K1, K2, K3 31 tế bào thầnkinhở lớp ẩn phân bốđều trong đoạn [−0.0357, 1.0357] 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 42
Thí dụ điều khiển học dùng mạng RBF (tt) Quá trình học: Tại mỗi thời điểm lấy mẫu hệ thống học thực hiện các tác vụ sau: Đolo lường bi ếnnho hoạch định điểmmlàmvi làm việc Đọc độ lợi điều khiển từ ngõ ra mạng RBF: T K (v(k)) = [K1(v(k)) K2 (v(k)) K3 (v(k))] Tính tín hiệu điều khiển hồi tiếp trạng thái u(k) = −K1x1(k) − K2 x2 (k) + K3r(k) Xuất tín hiệu điều khiển tác động vào đối tượng Sai lệch giữa đáp ứng của đối tượng với tín hiệu ra mong muốn củamôhìnhchua mô hình chuẩn đượccs sử dụng để cậppnh nhậtttr trọng số mạng RBF 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 43
Thí dụ điều khiển học dùng mạng RBF (tt) Thuật toán cập nhật trọng số mạng RBF: Bước 1: giá trị hiệu chỉnh độ lợi điều khiển ở ngõ ra của mạng RBF được tính d ựavàosaisa vào sai số giữa tín hi ệuracu ra củaamôhìnhchu mô hình chuẩn và tín hiệu ra của hệ thống theo công thức: δK(v(k)) = αe(k)φ(k) Trong đó: α là hệ số dương nhỏ e(k) = y ref (k) − y(k) T φ(k) = [x1(k) x2 (k) r(k)] Bước 2: các trọng số lớp ra của mạng RBF được cập nhật bằng thuậttt toá n suy gi ảm độ dốc: (l+1) (l ) wij = wij −ηziδK j (v(k)) (i = 1 31; j = 1 3) Trong đó: zi là ngõ ra c ủata tế bào th ầnkinhthn kinh thứ i ở lớp ẩn. 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 44
Thí dụ điều khiển học dùng mạng RBF (tt) Mô p hỏng kết quả: Cứ 60 chu kỳ lấy mẫu giá trị μ(k) thay đổi một lần Ba giá tr ị đầu tiên c ủa μ(k) đượcgánbc gán bằng 010.1; 030.3; 060.6 Các giá trị sau đó được gán ngẫu nhiên trong đoạn [0,1] 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 45
Thí dụ điều khiển học dùng mạng RBF (tt) Kết quả học luật điều khiển: Độ lợiih hồiii tiếp trạng thái K1(v) 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 46
Thí dụ điều khiển học dùng mạng RBF (tt) Kết quả học luật điều khiển: Độ lợiih hồiii tiếp trạng thái K2(v) 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 47
Thí dụ điều khiển học dùng mạng RBF (tt) Kết quả học luật điều khiển: Độ lợiih hồiii tiếp trạng thái K3(v) 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 48
Thí dụ điều khiển học mờ Đối tượng: tên lửa một tầng có mô hình toán học đơn giản cho bởi phương trình: dv(t) ⎛ m ⎞ ⎛ R ⎞ 2 ⎛ ρa ACd ⎞ = u(t)⎜ ⎟ − g0 ⎜ ⎟ − 0.5v (t)⎜ ⎟ dt ⎝ M − mt ⎠ ⎝ R + y(t) ⎠ ⎝ M − mt ⎠ Bài toán đặtralàđiều khiểnvậntốccủatênlửa theo tín hiệu đặt 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 49
Thí dụ điều khiển học mờ (tt) Cơ chế họccc củaha hệ thống nh ư sau: Quan sát dữ liệu vào ra của hệ thống điều khiển mờ. Đánh giá chất lượng của hệ thống điều khiển. Tự chỉnh thông số bộ điều khiển mờ để đạt được chất lượng mong muốn (chất lượng mong muốn xác định bởi mô hình chuẩn trong s ơ đồ điều khi ển). Lưu trữ tri thức (qui luật chỉnh định thông số) vào bộ nhớ. 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 51
Thí dụ điều khiển học mờ (tt) Bộ điều khiển:Bộ điều khiển đượccs sử dụng là b ộ điều khiểnPDmn PD mờ gồm các qui tắc Sugeno với mệnh đề kết luận là hằng số. Tín hiệuvàocủabộđiều khiểnPDmờ là: sai số e(k) = r(k) − y(k) biếnthiênsaisố: Δe(k) = [e(k) − e(k −1)]/T Tín hiệuracủabộđiều khiểnlàu(k).Cáchệ số chuẩn hóa ở ngõ và ngõ ra củabộđiều khiểnlàKE, KD,vàKU đượcchọnnhư sau: 1 1 K = K = K = 10000 E 4000 D 2000 U 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 52
Thí dụ điều khiển học mờ (tt) Hàm liên thuộccủacác tậpmờ định nghĩacho biếnvào e(k) và Δe(k): 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 53
Thí dụ điều khiển học mờ (tt) Y (s) 0.2 Mô hình chuẩn: m = R(s) s + 0.2 Chất lượng của hệ thống được tính bằng sai lệch giữa tín hiệu ra của mô hình chuẩn và tín hiệu ra của đối tượng: em (k) = ym (k) − y(k) 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 55
Thí dụ điều khiển học mờ (tt) Cơ chế học: Nếu chất lượng mong muốn được thỏa mãn (em(k)≈0) thì cơ chế học sẽ không điều chỉnh bộ điều khiển mờ. Ngược lại, nếu chất lượng mong muốn không thỏa mãn (em(k) lớn) thì cơ chế học sẽ điều chỉnh bộ điều khiển mờ 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 56
Thí dụ điều khiển học mờ (tt) Mô hình ng ượccm mờ: Mô hình ngược mờ mô tả định tính đặc tính động học ngược của đối tượng điều khiển. Mô hình ngược được dùng để xác định sự thay đổi ở ngõ vào của đối tượng làm cho ngõ ra của đối tượng giống như ngõ ra của mô hình chu ẩn. Tín hiệu vào mô hình ngược là: em(k) và Δem(k) Tín hiệu ra mô hình ngược là: p(k) Các hệ số chuẩn hóa: 1 1 K Em = K = K = 10000 4000 Dm 2000 P 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 57
Thí dụ điều khiển học mờ (tt) Khối điềuchu chỉnh cơ sở tri th ức: Điều chỉnh bộ điều khiển mờ để hệ thống đạt được chất lượng điều khiển tốt hơn. Cho thông tin về thay đổi cần thiết ở ngõ vào của đối tượng là p(k), bộ điều chỉnh cơ sở tri thức sẽ cập nhật cơ sở tri thức của bộ điều khiểnmn mờ (mệnh đề kếttlu luậncn của các qui t ắc điều khiển) sao cho tác động điều khiển trước đó (tức u(k−1)) sẽ được thay đổi một lượng là p(k). u* (k −1) = u(k −1) + p(k) Muốn đạt được điều này ngõ ra c ủa các q ui t ắccm mờ tác động ở thời điểm lấy mẫu thứ (k−1) phải được thay đổi một lượng là: p(k) αi (k) = αi (k −1) + p(k) p(k) = KU 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 59