Điều khiển trượt thích nghi dùng mạng nơ-rôn
Bạn đang xem tài liệu "Điều khiển trượt thích nghi dùng mạng nơ-rôn", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
- dieu_khien_truot_thich_nghi_dung_mang_no_ron.pdf
Nội dung text: Điều khiển trượt thích nghi dùng mạng nơ-rôn
- TẠP CHÍ KHOA HỌC & CÔNG NGHỆ CÁC TRƯỜNG ĐẠI HỌC KỸ THUẬT . SỐ 71 - 2009 ĐIỀU KHIỂN TRƯỢT THÍCH NGHI DÙNG MẠNG NƠ - RÔN ADAPTIVE NEURAL SLIDING MODE CONTROL Nguyễn Đức Minh, Dương Hoài Nghĩa, Nguyễn Đức Thành Trường Đại học Bách khoa - Đại học Quốc gia Tp Hồ Chí Minh TÓM TẮT Dựa vào lý thuyết điều khiển trượt và kỹ thuật mạng nơ - rôn, bài báo này giới thiệu bộ điều khiển trượt thích nghi dùng mạng nơ - rôn (ANSMC) cho một lớp các đối tượng phi tuyến bất định, hoặc không rõ mô hình. Đầu tiên, dựa vào một hàm Lyapunov, một luật điều khiển trượt (SMC) được thiết kế để bảo đảm tính ổn định của hệ thống. Sau đó một mạng truyền thẳng được sử dụng để tạo tín hiệu ra cho bộ điều khiển. Cuối cùng giải thuật huấn luyện mạng được xây dựng sao cho quỹ đạo pha của hệ thống hội tụ về mặt trượt trong điều kiện đối tượng bất định. Kết quả mô phỏng trên hệ thống con lắc ngược, một đối tượng phi tuyến, không ổn định và không cực tiểu pha, đã cho thấy bộ điều khiển đề nghị không chỉ khắc phục được hiện tượng dao động mà còn có chất lượng và tính bền vững tốt. ABSTRACT Based on the sliding mode control theory and the neural network technique, this paper introduces a new adaptive neural sliding mode controller (ANSMC) for a class of uncertain or unknown nonlinear systems. First, based on a Lyapunov function candidate, a sliding mode controller (SMC) is designed to guarantee the stability of the system. Next, a feedforward neural network is introduced to provide the output of the sliding mode controller. Finally, the learning algorithm of the neural network is designed such that the state trajectories of the system converge to the sliding surface in presence of system uncertainty. Simulation results on an inverted pendulum, which is a nonlinear, unstable and non minimum phase system, show that the proposed control strategy can not only reduce the phenomenon of chattering in effect, but also has good dynamic performance and robustness. I. GIỚI THIỆU II. ĐIỀU KHIỂN TRƯỢT (SMC) Điều khiển trượt là một phương pháp 2.1 Mô tả toán học đối tượng điều khiển điều khiển phi tuyến kinh điển, đơn giản và rất hiệu quả. Tuy nhiên do tín hiệu điều khiển trượt Xét một hệ thống phi tuyến với biểu diễn cổ điển có dạng hàm chuyển mạch nên tồn tại trạng thái sau : hiện tượng dao động với tần số cao (chattering) x1 x2 của các quỹ đạo pha xung quanh mặt trượt. Đã (2.1) có rất nhiều nghiên cứu, áp dụng mạng nơ - rôn xn 1 xn trong hệ thống điều khiển trượt, với mục đích là x f (x) g(x).u d tìm ra các luật điều khiển không phụ thuộc vào n các giới hạn của hệ thống, cũng như hạn chế y x1 hiện tượng chattering [2-7]. Trong đó u là tín hiệu vào điều khiển, y Bài báo này giới thiệu một bộ điều khiển là tín hiệu ra, x là vector trạng thái, d là tín hiệu trượt thích nghi dùng mạng nơ rôn với luật cập nhiễu. nhật đơn giản, nhằm giải quyết bài toán chattering. Phương pháp điều khiển đề nghị Giả thiết 1/ g(x) , f (x) , và d là các hàm không đòi hỏi phải nhận dạng trực tuyến các bị chặn. Bài toán điều khiển được đặt ra là : xác hàm phi tuyến trong mô hình của đối tượng. Bài định tín hiệu điều khiển u sao cho tín hiệu ra y báo gồm có 5 mục. Mục 2 trình bày phương bám theo tín hiệu đặt r. pháp điều khiển trượt SMC áp dụng cho các hệ 2.2 Mặt trượt phi tuyến bất định. Mục 3 giới thiệu bộ điều khiển đề nghị ANSMC. Mục 4 trình bày một số Định nghĩa tín hiệu sai lệch : mô phỏng. Mục 5 trình bày các kết luận. 1
- TẠP CHÍ KHOA HỌC & CÔNG NGHỆ CÁC TRƯỜNG ĐẠI HỌC KỸ THUẬT . SỐ 71 - 2009 e y r (2.2) u k.sign(g(x)).sign(S) (2.10) và hàm S : Nhận xét : (2.10) cho thấy luật điều khiển chỉ phụ thuộc vào chặn trên của , dấu của g(x) và (n 1) (n 2) S e cn 1e c2e c1e (2.3) mặt trượt S. Tín hiệu điều khiển không liên tục tại thời điểm quỹ đạo pha đi qua mặt trượt Trong đó c1, , cn-1, là các hệ số được chọn trước sao cho đa thức đặc trưng của (2-3) . thỏa mãn điều kiện Hurwitz (có tất cả các III. ĐIỀU KHIỂN TRƯỢT THÍCH NGHI nghiệm với phần thực âm). Kết quả là khi S = 0, DÙNG MẠNG NƠ - RÔN (ANSMC) tín hiệu sai lệch e 0 khi t . Phương 3.1 Hệ thống điều khiển ANSMC trình S = 0 xác định một mặt cong trong không gian n chiều, gọi là mặt trượt (sliding surface). Xét một mạng nơ - rôn dùng làm bộ điều khiển ANSMC dạng truyền thẳng q lớp có Vấn đề đặt ra là : xác định luật điều khiển phương trình biểu diễn tổng quát : u để đưa các quỹ đạo pha của hệ thống về mặt trượt và duy trì trên đó một cách bền vững đối u f N N(E,W ) (3.1) với các biến động của f(x), g(x) và d. Trong đó E là vectơ ngõ vào, W là bộ 2.3 Luật điều khiển cho hệ bất định vector trọng số của mạng. Tất cả các trọng số Lấy đạo hàm (2.3) và sử dụng (2.1), (2.2) của mạng được khởi tạo với giá trị ban đầu là ta có: không. Các giá trị này sẽ được cập nhật trực tuyến theo lý thuyết điều khiển trượt, sao cho (n) (n 1) S e cn 1e c2e c1e S 0, khi t . (n 1) (n) f (x) cn 1e c2e c1e d r g(x).u 3.2 Luật cập nhật thích nghi (2.4) Từ (2-5), điều kiện để S 0, khi t là : 1 Định nghĩa : V S 2 (2.5) 2 V S.S 0 (3.2) S u Ta có : Hay S. w 0 (3.3) u w V S.S S.( f (x) r (n) c e(n 1) c e c e d) g(x).S.u n 1 2 1 Từ (2 -4) suy ra : S . g(x) . (x) g(x).S.u t (n 1) (n) S f (x) cn 1e c2e c1e d r g(x).u dt S(0) (2.6) 0 (3.4) Với : S t Hay g(x).dt h(x) (3.5) 1 0 (x) ( f (x) rn c e(n 1) c e c e d) u g(x) n 1 2 1 (3-3) sẽ thỏa mãn nếu : (2.7) T u w .sign(h).sign(S). (3.6) Để S 0 khi t , chọn u sao cho w V 0 với S 0 , và V 0 khi S 0. Trong đó là hằng số dương. Rời rạc hóa (3- Từ 2.6 suy ra luật điều khiển : 6) với chu kỳ lấy mẫu là T ta có : u .sign(g(x).S) (2.8) T w(k 1) w(k) u .sign(h).sign(S). với (x) 0 , 0 0 (2.9) T w Có thể chọn bằng một hằng số (3.7) k sup( (x)) . Khi đó : 2
- TẠP CHÍ KHOA HỌC & CÔNG NGHỆ CÁC TRƯỜNG ĐẠI HỌC KỸ THUẬT . SỐ 71 - 2009 (n 1) (n 2) S e cn 1e c2e c1e Luật cập S nhật T R [r , r, r n 1 ] y Bộ điều khiển u + Đối tượng T mạng nơ -rôn _ E [e, e, e(n 1) ] T X [x1, x2 , xn ] Hình 1. Hệ thống điều khiển ANSMC. Đặt w w(k 1) w(k) , ta có : Áp dụng luật cập nhật (3-8) và triển khai luật chain, ứng với các trọng số cho nơ rôn ở lớp ra, T u ta có : w .sign(h).sign(S). (3.8) w T u w (k 1) w (k) .sign(h).sign(S). Với .T o o (3.9) wo Nhận xét : (3.8) cho thấy luật cập nhật trọng wo (k) .sign(h).sign(S).Z số chỉ phụ thuộc dấu của h(x) và dấu của mặt Tương tự như trên, luật cập nhật cho các trọng trượt S. số của các nơ rôn ở lớp ẩn: 3.3 Bộ điều khiển ANSMC 1 w (k 1) w (k) .sign(h)sign(S). .w (1 z2 ).E Xét mạng truyền thẳng một lớp ẩn có cấu trúc i i 2 oi i như hình 2. Gọi n là số tín hiệu ở lớp vào, m là (3.10) số nơ rôn ở lớp ẩn, hàm tác động lớp ẩn là hàm sigmoid lưỡng cực, hàm tác động lớp ra là hàm IV. MÔ PHỎNG T tuyến tính, E [e1 e3 en ] là vetor ngõ Phần này giới thiệu các kết quả mô phỏng hệ T thống điều khiển SMC và ANSMC cho đối vào, Z [z1 z3 z m ] là vector ngõ ra lớp ẩn, u là ngõ ra mạng, tượng là con lắc ngược trên xe. Mục đích điều khiển là giữ thăng bằng cho con lắc ở vị trí w [w w w ]T là vector trọng số o o1 o2 om ngược 0 (hình 3). T của nơ rôn ở lớp ra, wi [wi1 wi2 wom ] là vector trọng số của nơ rôn thứ i ở lớp ẩn. w11 z1 e1 e2 w o1 e3 z w u i oi wij wo en-1 m en wmn zm Hình 2. Cấu trúc của mạng nơ - rôn một lớp ẩn Hình 3. Mô hình con lắc ngược trên xe. dùng làm bộ điều khiển ANSMC. 3
- TẠP CHÍ KHOA HỌC & CÔNG NGHỆ CÁC TRƯỜNG ĐẠI HỌC KỸ THUẬT . SỐ 71 - 2009 Các thông số của đối tượng điều khiển Mô phỏng dùng điều khiển ANSMC. như sau: khối lượng xe M = 2 kg, khối lượng của con lắc m = 0.1kg, và chiều dài cánh tay đòn 0.5m. Gọi z là khoảng cách vị trí xe so với gốc tọa độ, là góc con lắc so với phương thẳng đứng, u là lực tác động lên xe con lắc. Hệ phương trình động học cho xe con lắc được mô tả như sau. (M m)z ml u (4.1) m.z m.l. ml (4.2) Rút gọn và biểu diễn dưới dạng phương trình biến trạng thái : x1 x2 Hình 5. Phiên điều khiển đầu tiên của ANSMC. (4.3) x2 a.x1 b.u 20.58.x1 u Trong đó: a (M m).g / M.l , b 1/ M.l , x1 . Mô phỏng dùng điều khiển SMC Chọn : S c.x1 x2 4.x1 x2 (4.5) Luật điều khiển trượt : u k.sign(b).sign(S) k.sign(S) (4.6) Mô phỏng với góc lệch ban đầu Hình 6. Phiên điều khiển thứ hai của ANSMC. 0.3 rad và hệ số k = 10. Ta được kết quả Dùng bộ điều khiển ANSMC với mạng ở hình 4. Ta thấy hiện tượng chattering thể hiện nơ - rôn được sử dụng là mạng một lớp ẩn, với rất rõ ở đáp ứng u(t). hai ngõ vào ( e và e ), lớp ẩn có 6 nơ rôn với hàm tác động là hàm sigmoid lưỡng cực. Lớp ra có một nơ rôn với hàm tích hợp tuyến tính và hàm tác động tuyến tính. Hệ số học được chọn là 0.05 cho phiên điều khiển đầu, và 0.01 cho các phiên điều khiển sau, thời gian lấy mẫu là 0.01s. Kết quả mô phỏng được thể hiện ở hình 5 (phiên điều khiển đầu tiên) và hình 6 (phiên điều khiển thứ hai). Ta thấy hiện tượng chattering đã được khắc phục (không còn tồn tại ở đáp ứng của u). Mặt khác, chất lượng của phiên điều khiển thứ 2 được cải thiện rất rõ so với phiên đầu tiên. Hình 4. Kết quả mô phỏng dùng điều khiển Thực hiện mô phỏng trong trường hợp SMC. thông số mô hình xe con lắc thay đổi và trong điều kiện có nhiễu. Cụ thể là thay M= 5kg, m= 0.5kg, l=0.3m, và dưới tác động của nhiễu trắng ở ngõ ra. Kết quả mô phỏng ở hình 7 cho thấy 4
- TẠP CHÍ KHOA HỌC & CÔNG NGHỆ CÁC TRƯỜNG ĐẠI HỌC KỸ THUẬT . SỐ 71 - 2009 hệ thống bền vững với sai số mô hình và với V. KẾT LUẬN nhiễu. Bài báo này đã giới thiệu một phương pháp điều khiển trượt thích nghi dùng mạng nơ - rôn. Lý thuyết và kết quả mô phỏng đã cho thấy bộ điều khiển ANSMC đã khắc phục được nhược điểm cơ bản của điều khiển trượt đó là hiện tượng chattering. Luật cập nhật cho bộ điều khiển ANSMC đơn giản, và không cần phải nhận dạng online hàm f(x) như trong các bộ điều khiển NSMC [2], [3], [4], [6], [7]. Luật điều khiển ANSMC được hình thành trong quá trình điều khiển, và có tính kế thừa : phiên điều khiển sau có chất lượng tốt hơn phiên điều khiển trước. Luật cập nhật ANSMC đơn giản, và có thể mở rộng cho các loại cấu trúc mạng Hình 7. Tính bền vững với sai số mô hình và khác như mạng RBF, hoặc nơ - rôn mờ. nhiễu. TÀI LIỆU THAM KHẢO 1. Vadim Utkin et al; Sliding Mode Control in Electromechanical Systems; Taylor & Francis, 1999. 2. Hiroshi Morioka et al; Neural Network Based Chattering Free Sliding Mode Control; Proceedings of SICE Annual Conference, 1995. 3. A. Sabanovit et al; Neural Network Application in Sliding Mode Control Systems; IEEE Workshop on Variable Structure Systems, 1996. 4. M.O. Efe, O. Kaynak, X. Yu and B. M. Wilamowski; Sliding Mode Control of Nonlinear Systems Using Gaussian Radial Basis Function Neural Networks; Int. Joint Conf. On Neural Networks (IJCNN’01), 2001. 5. Chun-Hsien Tsai, Hung-Yuan Chung; Neuro-Sliding Mode Control With Its Applications to Seesaw Systems; IEEE Transaction on Neural Networks, Vol. 15, No.1, 2004. 6. Tri V.M. Nguyen, et al; Sliding Mode Neural Controller for Nonlinear Systems with Higher Order and Uncertainties; Proceedings of the 2004 IEEE Conference on Robotics, Automation and Mechatronics, Singapore, 2004. 7. Juzhu Peng et al; A Neural Network Sliding Mode Controller with Application to Robotic Manipulator; Proceedings of the 6th World Congress on Intelligent Control and Automation, 2006. Địa chỉ liên hệ: - Dương Hoài Nghĩa - Tel: 0918.416.425, Email : dhnghia@hcmut.edu.vn - Nguyễn Đức Minh - Tel: 0909.125.585, Email: ducminhdl@yahoo.com.vn Khoa Điện - Điện tử, Trường Đại học Bách khoa Tp Hồ Chí Minh 5