Nguyên tắc tối đa của L.S. Pontryagin trong lý thuyết hệ thống tối ưu.

Trong phần này chúng ta sẽ chứng minh tính chất nghiệm của phương trình nhiệt một chiều, được gọi là nguyên tắc giá trị tối đa. Nó có thể được xây dựng như một định lý.

Định lý. Nếu chức năng bạn(x,t), xác định và liên tục trong một miền đóng , thỏa mãn phương trình dẫn nhiệt ở vùng này

thì giá trị lớn nhất và nhỏ nhất của hàm u(x,t)đạt được tại thời điểm ban đầu hoặc tại các điểm biên x = 0 hoặc x = l.

Hàm rõ ràng thỏa mãn phương trình (40) và đạt giá trị tối đa (tối thiểu) tại bất kỳ điểm nào. Tuy nhiên, điều này không mâu thuẫn với định lý, vì từ các điều kiện của nó, nó suy ra rằng nếu đạt được giá trị tối đa (tối thiểu) bên trong vùng thì nó cũng phải đạt được hoặc tại t= 0 hoặc tại x = 0 orpri x=l.

Ý nghĩa vật lý của định lý này là hiển nhiên như sau. Nếu nhiệt độ tại ranh giới hoặc tại thời điểm ban đầu không vượt quá một giá trị nhất định M, thì khi không có nguồn nhiệt, nhiệt độ lớn hơn M.

Chúng ta hãy tập trung vào việc chứng minh định lý cho giá trị lớn nhất. Nó được thúc đẩy bởi điều ngược lại. Vậy hãy để M– giá trị hàm tối đa bạn(x,t) Tại t = 0 (0 ≤ xtôi) hoặc khi x = 0 orpri x = l(0 ≤ tT). Bây giờ chúng ta giả sử rằng tại một điểm nào đó trong vùng ( x 0 ,t 0), sao cho 0< x 0 < tôi u0< t 0 ≤ T, chức năng bạn(x,t) đạt giá trị cực đại, vượt quá M bởi giá trị ε, tức là

Khi đó tại điểm ( x 0 ,t 0) các mối quan hệ phải được thỏa mãn

và đối với tất cả các giá trị, dấu bằng sẽ được thỏa mãn.

Ở đâu k – hệ số không đổi. Rõ ràng là

Hãy chọn sao cho kt nhỏ hơn ε/2, tức là , thì giá trị lớn nhất v(x,t) Tại t = 0 (0 ≤ xtôi) hoặc khi x = 0 orpri x = l sẽ không vượt quá , tức là

(Tại t = 0 hoặc x = 0 hoặc x = l), (44)

vì đối với những lập luận này, số hạng đầu tiên trong công thức (43) không vượt quá M, và thứ hai.

Do tính liên tục của hàm v(x,t), đến một lúc nào đó nó phải ( x 1 ,t 1) đạt giá trị tối đa và

khoảnh khắc trong thời gian t 1 hoàn toàn lớn hơn 0 và , vì for hoặc , hoặc bất đẳng thức (44) đúng. Tại điểm ( x 1 ,t 1), tương tự với (41) và (42), cần có

Ghi nhớ định nghĩa hàm v(x,t) (43), ta được

Nó theo sau đó

những thứ kia. phương trình (40) tại điểm trong ( x 1 ,t 1) không hài lòng. Điều này chứng tỏ rằng giải pháp bạn(x,t) phương trình dẫn nhiệt (40) bên trong vùng không thể lấy giá trị vượt quá giá trị lớn nhất bạn(x,t) ở biên giới.



Phần thứ hai của định lý về giá trị nhỏ nhất có thể được chứng minh tương tự.

Hãy trình bày và chứng minh hệ quả của nguyên lý giá trị cực đại:

Hệ quả 1. Nếu hai nghiệm của phương trình (40) và thỏa mãn điều kiện:

,

Bằng chứng. Do tính chất tuyến tính của (40) nên hàm số là nghiệm của nó nên thỏa mãn nguyên lý giá trị cực đại. Trong trường hợp này:

Kể từ đây:

nếu không nó sẽ có giá trị tối thiểu âm. Hệ quả 1 đã được chứng minh.

Hệ quả 2. Nếu ba nghiệm của phương trình (40) và thỏa mãn điều kiện:

với , và , thì bất đẳng thức tương tự đúng với mọi .

Bằng chứng.Điều này được thực hiện đơn giản bằng cách áp dụng Hệ quả 1 cho các cặp hàm số và , và .

Ta xét nghiệm của phương trình (1), tương ứng với điều kiện ban đầu và điều kiện biên có dạng:

Giả sử có một nghiệm của phương trình (40) tương ứng với các điều kiện biên và nhiễu loạn ban đầu được xác định bởi các hàm , và , sao cho:

Sử dụng Hệ quả 3, chúng ta có thể kết luận rằng: , ngụ ý rằng nghiệm của các bài toán gốc và bài toán nhiễu loạn càng gần nhau càng tốt.

Nguyên lý cực đại xác định các điều kiện cần thiết để điều khiển tối ưu trong hệ thống điều khiển phi tuyến. Nó cũng được mở rộng cho các trường hợp áp đặt các hạn chế đối với tọa độ của trạng thái hệ thống. Chúng ta hãy xem xét định lý chính của nguyên lý tối đa và đưa ra một công thức điều khiển tối ưu thuận tiện hơn.

Giả sử điều khiển tối ưu được mô tả bằng hệ phương trình vi phân phi tuyến:

(1)

hoặc ở dạng vectơ:

--vector chiều của trạng thái đối tượng

--vector chiều của hành động điều khiển

- hàm của vế phải của phương trình (1)

Chúng tôi giả sử rằng vectơ điều khiển lấy các giá trị từ một số vùng đóng của không gian điều khiển chiều Ur. Giả sử rằng các hàm
liên tục trong mọi đối số và có đạo hàm liên tục đối với các biến trạng thái . Chúng ta hãy gọi những biện pháp kiểm soát được chấp nhận là những biện pháp kiểm soát
, là các hàm liên tục từng phần của thời gian và lấy các giá trị từ tập U.

Bài toán chính của điều khiển tối ưu được phát biểu như sau: trong số tất cả các điều khiển được chấp nhận đưa điểm biểu diễn trong không gian pha X từ vị trí ban đầu đến cuối cùng , nếu những điều khiển này tồn tại. Và bạn cần tìm các điều khiển có chức năng:

(2)

đạt đến mức tối thiểu.

Hãy giới thiệu một biến mới , được xác định bởi các phương trình vi phân sau:

(3)

Đây
là tích phân của hàm (2).

Bằng cách thêm phương trình (3) vào hệ phương trình (1), chúng ta thu được:


(4)

Hãy viết (4) dưới dạng vectơ. Để làm điều này, chúng tôi đưa vào xem xét vectơ thứ (n+1) của tọa độ trạng thái:
, thì ở dạng vectơ phương trình này sẽ được viết như sau:

(5)

vectơ của phần bên phải của hệ thống (5).

Lưu ý rằng hàm vectơ
không phụ thuộc vào tọa độ vectơ . Hãy ký hiệu bằng điểm có tọa độ
trong không gian pha thứ (n+1) . Cho phép
- một số điều khiển được chấp nhận mà quỹ đạo pha tương ứng (1) đi qua
qua điểm . Và khi sự bình đẳng được thực hiện
qua điểm .

Từ phương trình (2), suy ra tọa độ được xác định bởi đẳng thức:

Nếu như
, thì ta sẽ có:

Như vậy, trong không gian quỹ đạo pha của hệ thống (5), tương ứng với cùng một điều khiển
, đi qua tại
qua điểm
, và khi nào
qua điểm
. Điều này được minh họa bằng hình sau:

Gọi P là một đường thẳng trong không gian , đi qua điểm
và song song với trục . Khi đó bài toán chính của điều khiển tối ưu có thể được phát biểu như sau:

Trong không gian có (n+1) chiều điểm bắt đầu được chỉ định
và đường thẳng P song song với trục và đi qua điểm
. Trong số tất cả các điều khiển được chấp nhận có tính chất là nghiệm của hệ (5) với điều kiện ban đầu
đi qua điểm của đường thẳng P cần chọn điều khiển sao cho tọa độ của điểm sẽ có ý nghĩa tối thiểu.

Bài toán được xây dựng là bài toán cực trị có điều kiện Mayer. Tuy nhiên, do những hạn chế đối với việc kiểm soát cho phép bằng các phương pháp tính biến phân cổ điển nên bài toán này không thể giải được.

Xây dựng định lý cho điều kiện cần của cực trị:

Hãy để chúng tôi giới thiệu các biến phụ trợ
, thỏa mãn hệ phương trình sau:


(6)

Hệ (6) được gọi là liên hợp đối với hệ phương trình (5). Nếu chúng ta chọn một số biện pháp kiểm soát có thể chấp nhận được
trên phân khúc
và tìm giải pháp tương ứng
với điều kiện ban đầu cho trước
, thì khi thay vào hệ phương trình điều khiển (6)
và giải pháp
, chúng ta thu được một hệ phương trình đồng nhất tuyến tính:


(7)

Hệ (7) thỏa mãn điều kiện tồn tại và duy nhất nghiệm của hệ phương trình vi phân. Hệ phương trình (5) và (6) có thể kết hợp thành một dạng ký hiệu; để làm được điều này cần xét đến hàm H:

(8)

Khi đó hệ (5) và (6) sẽ được viết như sau:


(9)


(10)

Lưu ý rằng vectơ hàm

liên tục ở mọi nơi ngoại trừ các điểm gián đoạn của điều khiển chấp nhận được
. Các hàm vectơ này có đạo hàm liên tục. Đối với giá trị cố định

chức năng H chỉ trở thành chức năng điều khiển
.


Tính đặc thù của nhiệm vụ để đạt hiệu suất tối đa bắt đầu ảnh hưởng khi ghi lại các tiêu chí chất lượng. Đối với những vấn đề này, tiêu chí chất lượng là hàm (5.1) sau đây

Vì vậy, cần phải tìm một điều khiển trong đó việc chuyển đối tượng điều khiển từ trạng thái ban đầu sang trạng thái cuối cùng được thực hiện trong thời gian tối thiểu có thể.

Trình tự giải các bài toán đang xét không khác với trình tự giải các bài toán khác được giải trên cơ sở nguyên lý tối đa:

Biên soạn Hamiltonian;

Xác định sự phụ thuộc của tác động điều khiển tối ưu vào các biến liên hợp dựa trên việc tối đa hóa Hamiltonian;

Lập hệ phương trình vi phân liên hợp;

Xây dựng một hệ thống phương trình vi phân tổng quát, trong số các giải pháp trong đó tìm thấy hành động điều khiển mong muốn.

Khi xem xét các đối tượng điều khiển được mô tả bằng phương trình tuyến tính, các bài toán về hiệu suất cực đại có một đặc thù nhất định. Vấn đề là hàm Hamiltonian tương ứng với những bài toán này chứa điều khiển ở mức không cao hơn cấp độ thứ nhất và do đó, việc xác định giá trị lớn nhất của Hamiltonian không thể được thực hiện bằng cách đánh đồng đạo hàm bậc nhất của nó đối với điều khiển bằng 0. Việc tìm kiếm giá trị lớn nhất của Hamiltonian trong trường hợp này được thực hiện bằng cách phân tích các tổ hợp có thể có giữa điều khiển và các biến của hệ phương trình liên hợp. Hóa ra điều khiển tối ưu phải có mô đun cực đại trong khoảng điều khiển và tại một số điểm của nó, ngay lập tức thay đổi dấu theo dấu của một hàm nào đó của các biến liên hợp. Trong điều kiện ảnh hưởng yếu của hệ phương trình liên hợp đến tác động điều khiển, có thể loại bỏ hoàn toàn phép giải của hệ phương trình liên hợp và coi thời điểm thay đổi dấu điều khiển (thời điểm chuyển mạch) là các biến độc lập.

Chúng ta hãy xem xét chi tiết hơn giải pháp cho vấn đề hiệu suất tối đa bằng ví dụ sau.

Đối tượng điều khiển:

Tiêu chí chất lượng:

Hamilton:

Phân tích các tổ hợp giá trị có thể có, chúng ta có thể kết luận rằng để đảm bảo giá trị lớn nhất của Hamiltonian, tùy thuộc vào điều khiển, cần phải thỏa mãn mối quan hệ sau:

Hệ phương trình liên hợp:

Hệ phương trình tổng quát:

Vì trong hệ phương trình (5.1) phương trình của các biến liên hợp không phụ thuộc vào trạng thái của đối tượng điều khiển nên các biểu thức của chỉ có thể tìm được từ hệ phương trình liên hợp mà không chú ý đến phương trình trạng thái điều khiển. sự vật.

Trong trường hợp này:

Phân tích các biểu thức thu được, chúng ta có thể kết luận rằng hành động điều khiển mong muốn có dạng sóng hình chữ nhật, thay đổi dấu không quá một lần. Hiển nhiên, thời điểm thay đổi dấu điều khiển (momen chuyển mạch) phải được chọn từ điều kiện đảm bảo các điều kiện biên xác định cho các trạng thái của đối tượng điều khiển. Một số phương pháp có thể được sử dụng để xác định điểm chuyển đổi.

Cách đầu tiên để xác định điểm chuyển đổi– phân tích. Khi sử dụng phương pháp này, cần thu được biểu thức phân tích về phản ứng của đối tượng điều khiển đối với tác động điều khiển ở dạng sóng hình chữ nhật. Chúng tôi sử dụng phép biến đổi Laplace cho mục đích này. Thời điểm chuyển mạch sẽ được ký hiệu là .

Hệ phương trình biến đổi Laplace của đối tượng điều khiển, có xét đến ảnh hưởng của sóng hình chữ nhật, có dạng:

Từ hệ phương trình này, chúng ta có thể thu được các biểu thức sau cho ảnh L của các trạng thái của đối tượng điều khiển:

hoặc, sau khi thực hiện phép biến đổi Laplace nghịch đảo, biểu thức phân tích thực tế cho các quá trình nhất thời theo thời gian:

Biểu thức cuối cùng cho phép chúng ta tìm cả giá trị của thời điểm chuyển mạch và thời điểm mà đối tượng điều khiển được chuyển sang trạng thái yêu cầu.

Cách thứ hai để xác định điểm chuyển đổi- tìm giá trị nhỏ nhất

Để có thể sử dụng thuật toán tìm kiếm cực tiểu giải bài toán điều khiển tối ưu, chúng ta xây dựng bài toán hiệu năng cực đại như sau:

Giả sử rằng hành động điều khiển là một hàm không đổi từng phần theo thời gian, thay đổi dấu tại thời điểm và đối tượng điều khiển được chuyển sang trạng thái cuối cùng tại thời điểm. Cần phải xác định các giá trị tham số sao cho đạt được giá trị tối thiểu của sự khác biệt giữa giá trị thực tế và giá trị yêu cầu của các trạng thái của đối tượng điều khiển tại thời điểm này. Giá trị chênh lệch được tính bằng tổng bình phương của chênh lệch giữa giá trị thực tế và giá trị được chỉ định của các trạng thái của đối tượng điều khiển tại thời điểm đó.

Việc tính toán các tham số điều khiển tối ưu bằng phương pháp tìm kiếm tối thiểu có thể được thực hiện bằng chương trình MATLAB sau:

Tệp Main5.m

% vectơ xấp xỉ ban đầu cho thời điểm chuyển mạch và

% thời gian kết thúc khoảng thời gian kiểm soát

T=fminsearch("fms5",ti0)

hàm số f=fms5(T)

% giải pháp số của sự khác biệt. cấp độ của đối tượng điều khiển trong quá trình hành động

% trên đó điều khiển sóng vuông

Ode45("odefun5",,);

tính toán % dư lượng

f=x(độ dài(t),1)^2+x(độ dài(t),2)^2;

%tạo một mảng các giá trị điều khiển để vẽ đồ thị

với i=1:length(t)

cốt truyện(t,x(:,1),t,u)

Tập tin odefun5.m

hàm f=odefun5(t,x)

Cách thứ ba để xác định điểm chuyển mạch– xây dựng đồ họa của đường chuyển mạch.

Phương pháp này có tính trực quan cao nhưng có thể áp dụng cho các đối tượng điều khiển bậc hai, bởi vì Hành vi của chỉ những đối tượng như vậy mới được mô tả đầy đủ bằng chân dung pha. Khi sử dụng phương pháp này, bài toán điều khiển tối ưu được giải quyết bằng cách xây dựng một đường chuyển mạch, vị trí hình học của các điểm trong không gian pha của đối tượng điều khiển, từ đó có thể chuyển đối tượng sang trạng thái cuối cùng mà không cần chuyển dấu điều khiển. Trong trường hợp tìm thấy đường chuyển mạch, quy trình điều khiển đối tượng như sau:

Sự điều khiển của một dấu hiệu nhất định được áp dụng cho đối tượng và dưới tác động của sự điều khiển này, đối tượng sẽ di chuyển cho đến khi điểm biểu diễn của nó nằm trên đường chuyển mạch

Khi điểm biểu diễn chạm vào đường chuyển mạch, dấu hiệu của hành động điều khiển thay đổi và điểm biểu diễn của nó bắt đầu di chuyển dọc theo đường chuyển mạch đến trạng thái đích. Do đó, việc đảm bảo rằng điểm tạo ảnh sẽ đạt trạng thái mục tiêu được đảm bảo bằng cách xác định đường chuyển mạch.

Một cách rõ ràng để xây dựng một đường chuyển mạch là quét toàn bộ mặt phẳng pha và ghi nhớ những điểm mà từ đó đạt được trạng thái mục tiêu bằng cách áp dụng điều khiển có độ lớn và dấu không đổi.

Tuy nhiên, có một cách để xây dựng toàn bộ đường dây chuyển mạch chỉ trong một bước. Thực tế là quỹ đạo pha của một vật chuyển động ngược thời gian từ điểm mục tiêu dưới tác động của hằng số điều khiển về độ lớn và dấu có tất cả các đặc tính của đường chuyển mạch. Do đó, đường chuyển mạch có thể được xây dựng bằng cách giải các phương trình vi phân của đối tượng điều khiển viết theo thời gian ngược. Về mặt toán học, sự chuyển đổi sang thời gian ngược được thực hiện bằng cách thay thế bằng trong các phương trình của vật. Nên được tính đến. rằng đường chuyển mạch có hai nhánh: một trong số chúng tương ứng với giá trị dương của hành động điều khiển và nhánh còn lại tương ứng với giá trị âm.

Phần mềm giải quyết vấn đề hiệu suất tối đa bao gồm hai phần:

Tập lệnh xây dựng quỹ đạo pha của một vật thể bằng cách giải số các phương trình của nó được viết theo thời gian ngược từ điểm bắt đầu tương ứng với trạng thái đích (xây dựng đường chuyển mạch);

Một tập lệnh xây dựng quỹ đạo pha của một vật thể bằng cách giải số các phương trình của nó được viết trong thời gian thông thường từ điểm bắt đầu tương ứng với trạng thái ban đầu (dấu của tác động điều khiển ngược với dấu được sử dụng khi xây dựng đường chuyển mạch).

Khoảng thời gian của quỹ đạo pha do tập lệnh thứ hai tạo ra phải đủ để nó giao nhau với đường chuyển mạch. Thời điểm giao nhau là thời điểm chuyển mạch mong muốn.

Ví dụ

Hãy xem xét các biến ngẫu nhiên

  • X số lần thành công trong mười hai thử nghiệm độc lập với phân phối Bernoulli với xác suất thành công θ trong mỗi thử nghiệm đó.
  • Y số lần thử nghiệm độc lập với phân phối Bernoulli cần thiết để đạt được ba lần thành công. Xác suất thành công trong mỗi lần thử là θ.

Sau đó xem xét X= 3 sẽ cho hàm khả năng

và cân nhắc Y= 12 sẽ cho hàm khả năng

Chúng tương đương nhau, vì cái này bằng tích của cái thứ hai một giá trị vô hướng. Nguyên tắc khả năng tối đa trong trường hợp này nói rằng các kết luận rút ra về giá trị của biến θ phải giống nhau trong cả hai trường hợp.

Sự khác biệt quan sát X= 3 và quan sát Y= 12 chỉ trong thiết kế thí nghiệm: trong một trường hợp, ban đầu người ta quyết định thực hiện 12 lần thử, và trường hợp còn lại là tiếp tục cố gắng cho đến khi có ba lần thành công. Kết quả sẽ giống nhau trong cả hai trường hợp. Vì vậy, nguyên tắc khả năng tối đa đôi khi được thể hiện như sau:

Kết luận phải phụ thuộc chỉ từ kết quả thí nghiệm và không phải từ thiết kế cuộc thí nghiệm.

Luật khả năng tối đa

Một khái niệm liên quan đến nguyên tắc khả năng tối đa là luật khả năng tối đa, nói rằng tỷ lệ của giá trị tham số nào được áp dụng nhiều hơn bằng tỷ lệ của các hàm khả năng của chúng. Khi đó thái độ

là thước đo giá trị bao nhiêu x chấp nhận một tham số Một liên quan đến b. Như vậy, nếu tỷ số bằng 1 thì không có sự khác biệt, còn nếu lớn hơn 1 thì Một thích hợp hơn b, và ngược lại.

Từ nguyên tắc khả năng tối đa và quy luật khả năng tối đa, theo đó tham số tối đa hóa hàm khả năng là tốt nhất. Đây là cơ sở của phương pháp khả năng tối đa nổi tiếng.

Bối cảnh lịch sử

Nguyên tắc khả năng tối đa lần đầu tiên được đề cập trong bản in. Tuy nhiên, những điều cơ bản của nguyên lý và ứng dụng của nó trong thực tế đã được công bố trước đó trong các tác phẩm của R. A. Fisher trong

Các lập luận ủng hộ và phản đối nguyên tắc khả năng tối đa

Nguyên tắc khả năng tối đa không được mọi người chấp nhận. Một số phương pháp thống kê truyền thống thường được sử dụng, chẳng hạn như kiểm tra giả thuyết thống kê, mâu thuẫn với nguyên tắc khả năng tối đa. Chúng ta hãy xem xét ngắn gọn một số ưu và nhược điểm của nguyên tắc này.

Sự phụ thuộc của kết quả vào việc tổ chức thí nghiệm

Các sự kiện chưa thực hiện có vai trò trong một số phương pháp thống kê phổ biến. Ví dụ, kết quả của việc kiểm tra giả thuyết thống kê có thể phụ thuộc vào xác suất tin cậy nhiều hoặc thậm chí nhiều hơn sự phân bố của tham số chưa biết. Và bản thân xác suất tin cậy có thể phụ thuộc vào việc tổ chức thí nghiệm.

Một số phương pháp kiểm tra giả thuyết cổ điển không dựa trên khả năng xảy ra. Một ví dụ thường được trích dẫn là bài toán dừng tối ưu. Giả sử tôi nói rằng tôi tung đồng xu 12 lần và nhận được 3 mặt ngửa. Từ đó bạn có thể rút ra một số kết luận về xác suất của đồng xu này. Bây giờ giả sử tôi tung đồng xu cho đến khi nó ngửa 3 lần, tổng cộng là 12 lần tung. Bây giờ bạn sẽ rút ra những kết luận khác chứ?

Hàm khả năng giống nhau trong cả hai trường hợp và tỷ lệ thuận

.

Theo nguyên tắc khả năng xảy ra, kết luận phải giống nhau trong cả hai trường hợp.

Giả sử một nhóm các nhà khoa học xác định xác suất của một kết quả nào đó (mà chúng ta gọi là “thành công”) thông qua một loạt thí nghiệm. Cảm giác thông thường cho chúng ta biết rằng nếu không có lý do gì để tin rằng khả năng thành công cao hơn thất bại và ngược lại, thì chúng ta nên đặt xác suất thành công là 0,5. Nhà khoa học Adam đã thực hiện 12 cuộc thử nghiệm, trong đó ông nhận được 3 lần thành công và 9 lần thất bại, sau đó ông qua đời.

Đồng nghiệp trong phòng thí nghiệm của ông, Bill, tiếp tục công việc của Adam và công bố kết quả kiểm tra giả thuyết. Ông đã kiểm tra giả thuyết rằng xác suất thành công P= 0,5 so với P < 0.5. Вероятность того, что в 12 испытаниях наступит не более 3 успехов, равна

đó là 299/4096 = 7,3%. Như vậy, giả thuyết không bị bác bỏ ở độ tin cậy 5%.

Charlotte sau khi đọc bài báo của Bill và viết một lá thư. Cô tin rằng Adam có thể đã tiếp tục cuộc thử nghiệm cho đến khi anh ta chết, tính đến thời điểm đó anh ta đã đạt được 3 lần thành công. Xác suất để ba lần thành công cần phải thực hiện 12 lần thử trở lên là

đó là 134/4096 = 3,27%. VÀ Hiện nay kết quả bị bác bỏ ở mức 5%.

Đối với những nhà khoa học này, sự phụ thuộc của kết quả thử nghiệm phụ thuộc vào thiết kế của thí nghiệm chứ không chỉ phụ thuộc vào tính hợp lý của kết quả.

Rõ ràng, những nghịch lý thuộc loại này được một số người coi là lập luận chống lại nguyên tắc khả năng, trong khi đối với những người khác, chúng minh họa tầm quan trọng của nguyên tắc này.

Văn học

Xem thêm

Liên kết

  • Anthony W. F. Edwards. "Khả năng." http://www.cimat.mx/reportes/enlinea/D-99-10.html
  • Jeff Miller. Công dụng sớm nhất được biết đến của một số từ toán học (L)
  • John Aldrich. Khả năng và xác suất trong các phương pháp thống kê của R. A. Fisher dành cho nhân viên nghiên cứu

Quỹ Wikimedia.

2010.

Bây giờ chúng ta hãy tính đến các hạn chế (2.2.2) về kiểm soát. Nếu trong quá trình điều khiển tối ưu các hàm không đạt tới các biên của tập (2.2.2) (có nghĩa là) thì các quan hệ (2.2.13), (2.2.14) được thỏa mãn cho chúng. Tuy nhiên, điều khiển tối ưu thường lấy giá trị biên hoặc - hơn nữa, điều khiển tối ưu có thể nhảy từ ranh giới này sang ranh giới khác. Những điều khiển như vậy đã là các hàm liên tục từng phần của thời gian.

Khi điều khiển tối ưu chạm tới biên của tập U, các quan hệ (2.2.13), (2.2.14) bị vi phạm. Trong trường hợp này, điều khiển tối ưu thỏa mãn nguyên lý cực đại của L. S. Pontryagin, được thiết lập và chứng minh dưới dạng định lý dưới đây.

Chuyển sang định lý này, chúng ta hãy làm rõ một số điều. Chúng ta hãy lấy một điều khiển chấp nhận được tùy ý và, trong các điều kiện ban đầu, tìm nghiệm của hệ (2.2.1): .

Thay nghiệm này và điều khiển vào (2.2.8), bây giờ, chúng ta xác định, theo một số điều kiện ban đầu tùy ý, nghiệm (2.2.8): . Đối với các giá trị cố định (không đổi) của vectơ, hàm H trở thành hàm của vectơ. Giá trị lớn nhất của hàm số này bằng và sẽ được ký hiệu là:

Giá trị cực đại (giá trị cao nhất) của hàm liên tục có thể đạt được ở cả hai điểm cực đại cục bộ của hàm này, tại đó

và trên các biên của tập hợp.

Để điều khiển tối ưu (trong đó ) lấy giá trị nhỏ nhất), cần tồn tại các hàm liên tục khác 0 thỏa mãn các phương trình (2.2.12) sao cho đối với bất kỳ biến nào thì hàm của biến đó đạt giá trị cực đại

trong trường hợp này, vào thời điểm cuối cùng các mối quan hệ được thỏa mãn

Nếu (2.2.11), (2.2.12) và (2.2.17) được thỏa mãn thì hàm của biến t là hằng số và do đó việc xác minh quan hệ (2.2.18) có thể được thực hiện không nhất thiết vào lúc này bất cứ lúc nào nhưng bất cứ lúc nào.

Việc chứng minh định lý khá phức tạp nên Phụ lục 2 chỉ đưa ra cách suy dẫn hệ thức chính (2.2.17) của định lý cho trường hợp đầu phải tự do (không xác định) và đầu phải cố định.

Mối quan hệ (2.2.17) và (2.2.18) có thể được viết dưới dạng đơn giản hơn:

Như vậy, điều kiện trung tâm trong Định lý 2.2.1 là điều kiện tối đa (2.2.19). Điều đó có nghĩa là nếu là các điều khiển tối ưu và là các quỹ đạo tối ưu thì chắc chắn sẽ có một nghiệm không đổi và như vậy) của hệ thống (2.2.12) mà hàm các biến của chúng đối với tất cả sẽ đạt cực đại trên U một cách chính xác dưới các điều khiển tối ưu. Vì vậy Định lý 2.2.1 đưa ra điều kiện cần thiết để đạt được tính tối ưu trong các bài toán điều khiển tối ưu thường được gọi là nguyên lý cực đại. Lưu ý rằng tại các điểm bên trong của tập U, các điều kiện (2.2.13), (2.2.14), cần thiết cho (2.2.19), được thỏa mãn để điều khiển tối ưu.

Ứng dụng thực tế của nguyên lý cực đại.

Làm thế nào chúng ta có thể sử dụng điều kiện (2.2.19) trong thực tế, vì các hàm và hằng số trong điều kiện này chưa được biết?

Ở đây họ tiến hành như sau: coi hàm ) là hàm của các biến và coi các biến là tham số, họ giải bài toán cực đại hóa hàm và tìm hàm

tại đó hàm số đạt được giá trị cao nhất.

Trong một số trường hợp, hàm (2.2.20) có thể được viết rõ ràng. Ví dụ, nếu vế phải của (2.2.1) có cấu trúc

và tích phân của hàm (2.2.5)

tập hợp được mô tả bởi bất đẳng thức U (2.2.2), khi đó

và hàm số này đạt giá trị lớn nhất trên U tại điểm có tọa độ

Công thức (2.2.22) cung cấp một lượng lớn thông tin về cấu trúc của điều khiển tối ưu: tọa độ của điều khiển tối ưu là hàm bước (hằng số từng đoạn) với các giá trị, trong khi mô men chuyển mạch được xác định bởi điều kiện

Vì vậy, hãy giả sử rằng hàm (2.2.20) đã biết. Xét hệ phương trình vi phân

Các hàm số và thuộc vế phải của các phương trình này đều đã biết. Nghiệm tổng quát của hệ (2.2.24), (2.2.25) phụ thuộc vào các hằng số tùy ý, được xác định từ các điều kiện biên (2.2.3), (2.2.4). Bài toán tích phân các phương trình (2.2.24), (2.2.25) trong điều kiện biên (2.2.3), (2.2.4) được gọi là bài toán giá trị biên (bài toán giá trị biên hai điểm).

Như vậy, nguyên lý cực đại cho phép chúng ta rút gọn lời giải của bài toán điều khiển chương trình tối ưu thành lời giải của bài toán giá trị biên.

Khó khăn khi giải nó là việc tích phân các phương trình (2.2.24), (2.2.25) trong “thời gian trực tiếp” là không thể, vì các điều kiện ban đầu chưa biết. Một trong những cách tiếp cận khả thi để giải bài toán giá trị biên là như sau. . Cho một vectơ tùy ý và tích phân (2.2.24), (2.2.25) trong các điều kiện ban đầu đã biết, chúng ta sẽ tìm các hàm và kiểm tra sự thỏa mãn đẳng thức (2.2.4). Nếu nó bị vi phạm, chúng ta chỉ định một vectơ khác và tích phân (2.2.24), (2.2.25) theo các điều kiện ban đầu, chúng ta thu được vectơ .

Nếu nó không trùng với giá trị đã cho, chúng ta tiếp tục quá trình cho đến khi tìm thấy một vectơ sao cho các điều kiện (2.2.4) được thỏa mãn với độ chính xác chấp nhận được. Với cách tiếp cận này, các phương pháp gradient được sử dụng khi nó được xác định từ điều kiện “khoảng cách” tối thiểu từ một vectơ nhất định.

Trong toán học tính toán, một số phương pháp đã được phát triển để giải gần đúng các bài toán giá trị biên: phương pháp bắn, phương pháp quét, một số phương pháp lặp,... Trong nhiều trường hợp, không thể tìm được từ điều kiện (2.2.19) dạng rõ ràng (2.2.22) của điều khiển tối ưu. Khi đó các phương trình (2.2.1), (2.2.6), hệ liên kết (2.2.12) và các điều kiện cực đại (2.2.19) tạo thành bài toán giá trị biên của nguyên lý cực đại. Bài toán này có một số đặc điểm cụ thể gây khó khăn cho việc sử dụng các phương pháp số tiêu chuẩn để giải các bài toán giá trị biên. Các đặc điểm như vậy bao gồm sự gián đoạn của các hàm thỏa mãn điều kiện tối đa (2.2.14), tính không duy nhất của chúng và tính chất phi tuyến của sự phụ thuộc (2.2.20) ngay cả trong các hệ thống tuyến tính. Ngoài ra, một đặc điểm của các bài toán giá trị biên liên quan đến nguyên lý cực đại, ngay cả trong trường hợp có thể tìm ra dạng điều khiển (2.2.20) rõ ràng, là khả năng hội tụ kém của chúng gây ra bởi tính không ổn định của hệ thống (2.2.24). ), (2.2.25). Một số kỹ thuật giải các bài toán giá trị biên theo nguyên lý cực đại được trình bày, ví dụ như trong.

Chúng ta hãy lưu ý rằng để kết luận rằng, mặc dù có nhiều phương pháp khác nhau để giải bài toán giá trị biên của nguyên lý cực đại bằng số, quá trình giải từng tối ưu hóa dựa trên nguyên tắc này là một bài toán sáng tạo độc lập, được giải trong khuôn khổ của nhánh động lực cụ thể để mà đối tượng điều khiển thuộc về, có tính đến các đặc điểm cụ thể của nó, được sử dụng để cải thiện sự hội tụ của nghiệm số của bài toán giá trị biên.

Ví dụ 2.2.1. Xây dựng hệ thống kiểm soát tiêu hao nhiên liệu tối ưu.

Chúng ta hãy xem xét đối tượng điều khiển được mô tả bởi các phương trình

Hãy đặt một ràng buộc lên sự kiểm soát

Hàm tối ưu biểu diễn mức tiêu hao nhiên liệu có dạng

Trạng thái ban đầu được đưa ra

và tình trạng tại thời điểm

Cần phải tìm tại đó đối tượng (2.2.26) chuyển từ trạng thái (2.2.29) sang trạng thái (2.2.30), trong khi các hạn chế (2.2.27) được thỏa mãn và hàm (2.2.28) nhận giá trị nhỏ nhất.

Chuyển sang xác định điều khiển tối ưu dựa trên nguyên lý cực đại, ta xây dựng hàm

phương trình cho các biến phụ

Điều khiển mang lại chức năng (2.2.31) tối đa được định nghĩa là

Các phương trình (2.2.26), (2.2.32), (2.2.33) tạo thành bài toán giá trị biên. Chuyển sang nghiên cứu, chúng ta viết nghiệm của hệ (2.2.32):

trong đó các số chưa biết phải được xác định sao cho điều khiển (2.2.33) đưa đối tượng (2.2.26) về trạng thái (2.2.30).

Chúng ta hãy tìm nghiệm của hệ (2.2.26) cho và . Trong trường hợp đầu tiên, nghiệm của hệ này có dạng . Nó phụ thuộc vào các hằng số R và p, trong khi . Quỹ đạo pha của hệ thống này là các đường tròn có tâm ở gốc (Hình 2.2.1, a). Các quỹ đạo pha của hệ (2.2.26) tại và cũng là các đường tròn, tâm của chúng nằm ở các điểm tương ứng (Hình 2.2.1, b, c).