Метод на неопределените множители на Лагранж в примери от механиката. Проблем на Лагранж с едно ограничение

1.9 Метод недефинирани множителиЛагранж

Естествено, решаване на проблеми условна оптимизациямного по-трудни решениязадачи безусловна оптимизация. Естествено е да се стремим да сведем проблема за условната оптимизация (търсене на относителен екстремум) до по-прост проблем за безусловна оптимизация (търсене на абсолютен екстремум). Тази процедура се извършва по метода на Лагранж. Нека да разгледаме същността на този метод.

Трябва да се намери условна крайност нелинейна функция

n променливи с m ограничения

(1.56)

Ограниченията на неравенството се трансформират в равенства, а свободните членове се прехвърлят в левите страни на ограниченията, т.е. система (1.56) се свежда до формата

(1.57)


В съответствие с метода на Лагранж вместо относителния екстремум на функцията (1.55) при ограничения (1.57) се търси абсолютният екстремум на функцията на Лагранж, който има следния вид:

където са неопределените множители на Лагранж, които, подобно на променливите, са желаните променливи.

Може да се види, че функцията на Лагранж включва целевата функция плюс всяко ограничение, умножено по множителя на Лагранж.

Доказано е, че относителният екстремум целева функция(1.55) при ограничения (1.57) съвпада с абсолютния екстремум на функцията на Лагранж (1.58).

Извършва се търсене на абсолютния екстремум на функция (1.58). известни методи. По-специално, частните производни на функцията на Лагранж се определят и равняват на нула:

(1.59)


Последните m уравнения представляват ограничения (1.57) на проблема за оптимизация.

Система (1.59) съдържа (m+n) уравнения и същия брой неизвестни.

Системата за решаване (1.59) ще даде координатите на абсолютния минимум на функцията на Лагранж (1.58) или относителния минимум на целевата функция (1.55) при ограничения (1.57).

Решението на система (1.59) се извършва с помощта на добре известни методи на изчислителната математика. Ако системата (1.59) е линейна, обикновено се използва методът на Гаус. Ако системата (1.59) е нелинейна – метод на Нютон.

1.10 Избор на метод за оптимизация

Преди да изберем метод за оптимизация, ще направим кратък анализ на проблемите, които разработваният софтуер трябва да реши:

програмата трябва да реши проблема с условното минимизиране, т.е. намерете относителния екстремум, тъй като в математически моделв допълнение към линейните ограничения ще се появят и нелинейни;

тъй като целевата функция е функция на няколко променливи, тя може да има няколко екстремума, в който случай програмата трябва да търси локален минимум.

След анализ на най-често използваните методи за оптимизация, за постигане на тази цел беше избран градиентният метод на квадратично програмиране, който е най-ефективният от горните градиентни методи, модифициран с методи на полиномиална апроксимация.

Предполага се, че целевата функция и граничните условия са апроксимирани чрез квадратични зависимости или полиноми от втори ред. Този метод ще бъде разгледан по-подробно по-късно в раздела „Разработване“. софтуерметод за оптимизация".

Този методви позволява да създавате надеждна програма, отговарящи на всички горепосочени изисквания.


2. Разработване на метод за оптимизация на ре активна мощност

Общата мощност на компенсиращите устройства, необходими в електроенергийната система (ЕЕС), се определя от уравнението на баланса реактивна мощност(6.1). Тази мощност трябва да бъде поставена във възли електрическа мрежас минимални разходи.

където е общата реактивна мощност, генерирана в ЕЕС, включително реактивната мощност, идваща от съседна ЕЕС;

Общата реактивна мощност на потребителите на ЕЕС, включително реактивната мощност, подадена към съседни ЕЕС;

Обща реактивна мощност за собствени нужди на централите;

Общи загуби на реактивна мощност;

Обща консумация на реактивна мощност в EPS.

Нека разгледаме най-простата схема съществуваща мрежа(фиг. 2.1). от източник на захранване с напрежение U, чрез съпротивлението на мрежата R, товарът се захранва с мощност S=P+jQ. На товарните шини е монтирано компенсаторно устройство с капацитет Qk.

Фигура 2.1 – Най-простата схемакомпенсация на реактивната мощност

Загубите на активна мощност в линията, ако потребителят няма компенсиращо устройство () са

. (2.2)

При инсталиране на компенсиращо устройство () при потребителя, тези загуби ще намалеят до стойността

. (2.3)

По този начин компенсацията на реактивната мощност позволява да се намалят загубите на активна мощност в захранващата верига и следователно да се подобрят техническите и икономически показатели на тази верига.

Нека да оценим въздействието на CG върху мрежовите разходи.

Изразът за общите разходи за пренос на мощност към товара при инсталиране на топлообменника ще има формата:

(2.4)

където ZK – разходи за CG;

соΔР – разходи за покриване на загубите на активна мощност в мрежата;

с – цена на единица загубена активна мощност;

зк – единични разходи за CG.

За да определим минимума на функция 3, приравняваме нейната производна на променливата QK на нула:


(2.5)

От (2.5) се определя икономически осъществимата реактивна мощност, чието предаване от източника към потребителя съответства на минималните разходи

(2.6)

Стойността на QE не зависи от активната мощност P, а зависи само от съотношението на разходните показатели zk и co и параметрите на мрежата U и R, през която се пренася мощността.

Сложен е въпросът за поставянето на компенсаторни устройства в електрическата мрежа на реална ЕЕС. проблем с оптимизацията. Предизвикателството е, че електроенергийните системи са големи системи, съставени от взаимосвързани подсистеми. Невъзможно е всяка отделна подсистема да се разглежда изолирано, тъй като свойствата големи системиопределя се от характера на взаимовръзките на отделните подсистеми.

При анализ на големи системи се използва системен подход, според която анализът голяма системасе извършва, когато се разделя на подсистеми, които не са пряко свързани една с друга, но си влияят повече чрез системата високо ниво.

Във връзка с разглеждания въпрос електрическата мрежа изглежда на различни нива, както е показано на фиг. 2.2. горното ниво е електрическа мрежа с напрежение 110 kV и повече. Тази сложна електрическа мрежа, представена от пълна еквивалентна схема, е показана на фиг. 2.2 условно като ES1. Реактивните мощности, генерирани от генератори на електроцентрали QES, компенсаторни устройства QK, електропроводи QС, както и реактивни мощности, протичащи през връзки със съседни ЕС2 и ЕС3 (Q12, Q21, Q13, Q31), осигуряват налична реактивна мощност Qр1 в ЕС1.

Фигура 2.2 – Разположение на блока за управление в електрическата мрежа

Второто ниво е набор от n отворени локални разпределителни мрежи с напрежение 35 kV и по-ниско, свързани към n възли на електрическата мрежа Най-високо нивочрез трансформатори T. Тези локални разпределителни мрежи не са пряко свързани една с друга, но си влияят една на друга чрез мрежата от по-високо ниво. Синхронни генератори, компенсатори и двигатели във всяка такава разпределителна мрежаса представени от една еквивалентна синхронна машина G. Консуматори ниско напрежение P+jQ се захранват от локални електрически мрежи чрез разпределителни трансформатори Т1.

Компенсиращите устройства могат да бъдат инсталирани на високоволтови (jQkv) и нисковолтови (jQks) шини на трансформатори Т, както и на 0,4 kV шини на разпределителни трансформатори Т1 и в самата мрежа 0,4 kV (jQkn). Стойността на мощността на тези HRSG подлежи на определяне.

Като цяло проблемът за оптимизиране на разположението на CP се формулира, както следва: определят се реактивните мощности на синхронните машини G, налични в 6...35 kV възли, мощността на CP в мрежи с всички напрежения Qkv, Qks, Qkn, както и стойностите на реактивните мощности Qei (i = 1, 2, …n), предавани в потребителската мрежа, което осигурява минимални общи разходи.

Изчисленията на компенсацията на реактивната мощност за мрежи от всякакъв тип се извършват както при проектирането на развитието на електрическите мрежи, така и при техните работни условия. При проектирането се определя мощността на топлообменника и се решава проблема с разпределението им в електрическата мрежа. При условия на работа определете оптимални режиминалични CU през деня. Критериите за оптималност в този случай са минималните загуби на мощност и енергия и съответствието на отклоненията на напрежението приемливи стойности.

При проектирането на верига за захранване, като правило, паричните разходи на тази верига са сведени до минимум. Намаляването на загубите на мощност чрез инсталиране на топлообменник намалява цената на веригата поради следните причини:

всеки kW загубена мощност трябва да се генерира в електроцентралите и следователно да се изразходва за тях пари в брой;

генерирането на загубена реактивна мощност в електроцентралите е много по-скъпо от потреблението (3 пъти!).

Компенсиращите устройства обаче изискват и финансови разходи.

В тази връзка възниква проблемът за определяне на оптималната мощност на компенсиращите устройства, която отговаря на минималните общи разходи. Този проблем принадлежи към проблема за неограничената оптимизация и може да бъде решен например чрез градиентни методи.

Нека разгледаме такъв проблем за главната верига на захранване (фиг. 2.3). Необходимо е да се определи мощността на компенсиращите устройства QK1 и QK2 във възли 1 и 2 въз основа на условието за минимални общи разходи за инсталиране на тези устройства и покриване на загубите на активна мощност във веригата.

Фигура 2.3 – Схема на захранване

Първоначални данни:

напрежение на веригата U;

линейни съпротивления R1 и R2;

реактивни товари на възли 1 и 2 Q1 и Q2;

специфични разходи за инсталиране на компенсиращи устройства зо;

специфични разходи за покриване на загуби на активна мощност c.

Целевата функция, която представлява общите разходи за инсталиране на компенсиращи устройства и покриване на загубите на активна мощност във веригата, има следния вид

където a1=R1∙co∙10-3/U2=0,0006;

a2=R2∙co∙10-3/U2=0,0004.

Въвеждането на числов коефициент 10-3 е необходимо, за да се приведат всички компоненти на целевата функция в едно измерение (cu).

За да решим проблема, избираме метода на координатно спускане. Нека определим частните производни на целевата функция Z по отношение на променливите Q1 и Q2:

(2.8)

Да вземем първоначалното приближение:

За тези стойности изчисляваме стойностите на целевата функция и нейните частични производни.

Да приемем, че по посока на променливата Qk2 целевата функция Z намалява по-силно, отколкото по посока на променливата Qk1, т.е.

(2.10)

По посока на променливата Qk2 ще започнем нашето спускане.

Да вземем размера на стъпката = 400 kvar. Първото приближение (първата стъпка) ще бъде Qk11=0, Qk21=400 kvar. Изчисляваме стойността на целевата функция Z1.

Втора стъпка: Qk12=0, Qk22=400 kvar. Изчисляваме стойността на целевата функция Z2.

Спускането по координатата Qk2 трябва да продължи до Zn

Нека направим нова стъпка в посока на друга променлива Qk1. Намира се нова стойност на целевата функция Z. Спускането по тази променлива продължава по същия начин както в посока Qk2 - до Zm

Точката с получените координати Qk1m-1, Qk2n-1 се намира в близост до минимума на целевата функция Z. При приетата дължина на стъпката = 400kvar не може да се получи по-точно решение. За да получите по-точно решение, е необходимо да намалите стъпката и да продължите спускането. Абсолютно сигурно е, че колкото по-малка е стъпката, толкова по-точен ще бъде резултатът. Не можем да постигнем такава точност чрез ръчно изчисление. За да се реши този проблем, би било препоръчително да се използва софтуер, предназначен за решаване на проблеми с нелинейно програмиране с нелинейни ограничения. Един такъв език за програмиране е C++.

Това се смяташе за неограничен оптимизационен проблем, т.е. намиране на абсолютния минимум. При решаването на поставения проблем, за да се намери оптималният режим на работа на мрежата на OJSC Ilyich Iron and Steel Works, е необходимо да се намери относителен минимум, тъй като системата от ограничения ще има нелинейна форма (вижте по-долу „Разработка на софтуер “). Така се изправяме пред задачата за условна оптимизация за реактивна мощност, за която използваме предварително избрания градиентен метод на квадратично програмиране.

Информация за работата „Анализ на режимите на работа на електрическите мрежи на OJSC Ilyich Iron and Steel Works и разработване на адаптивна система за управление на режимите на потребление на енергия“

Метод на множителяЛагранж(в англоезичната литература „Методът на LaGrange на неопределените множители“) ˗ е числен метод за решаване на оптимизационни проблеми, който ви позволява да определите „условния“ екстремум на целевата функция (минимална или максимална стойност)

при наличие на определени ограничения върху неговите променливи под формата на равенства (т.е. определен е обхватът на допустимите стойности)

˗ това са стойностите на аргумента на функцията (контролируеми параметри) в реалната област, при която стойността на функцията клони към екстремум. Използването на името „условен“ екстремум се дължи на факта, че върху променливите се налага допълнително условие, което ограничава обхвата на допустимите стойности при търсене на екстремума на функцията.

Методът на умножителя на Лагранж позволява проблемът за търсене на условен екстремум на целева функция върху набор от допустими стойности да се трансформира в проблем за безусловна оптимизация на функция.

В случай, че функциите И са непрекъснати заедно с техните частни производни, тогава има такива променливи λ, които не са едновременно равни на нула, при които е изпълнено следното условие:

Така, в съответствие с метода на умножителя на Лагранж, за да намеря екстремума на целевата функция върху множеството от допустими стойности, съставям функцията на Лагранж L(x, λ), която е допълнително оптимизирана:

където λ ˗ е вектор от допълнителни променливи, наречени неопределени множители на Лагранж.

Така проблемът за намиране на условния екстремум на функцията f(x) се свежда до проблема за намиране на безусловния екстремум на функцията L(x, λ).

И

Необходимото условие за екстремума на функцията на Лагранж се дава от система от уравнения (системата се състои от „n + m“ уравнения):

Решаването на тази система от уравнения ни позволява да определим аргументите на функцията (X), при които стойността на функцията L(x, λ), както и стойността на целевата функция f(x) съответстват на екстремума.

Големината на множителите на Лагранж (λ) е от практически интерес, ако ограниченията са представени във вид със свободен член в уравнението (константа). В този случай можем да разгледаме допълнително (увеличаване/намаляване) стойността на целевата функция чрез промяна на стойността на константата в системата от уравнения. По този начин множителят на Лагранж характеризира скоростта на промяна на максимума на целевата функция при промяна на ограничаващата константа.

Има няколко начина да се определи естеството на екстремума на получената функция:

Първи метод: Нека е координатите на екстремалната точка и е съответната стойност на целевата функция. Взема се точка, близка до точката, и се изчислява стойността на целевата функция:

Ако , тогава има максимум в точката.

Ако , тогава има минимум в точката.

Втори метод: Достатъчно условие, от което може да се определи естеството на екстремума, е знакът на втория диференциал на функцията на Лагранж. Вторият диференциал на функцията на Лагранж се дефинира, както следва:

Ако в даден момент минимум, ако , тогава целевата функция f(x) има условие максимум.

Трети метод: Също така, природата на екстремума на функцията може да се определи чрез разглеждане на Хесиана на функцията на Лагранж. Хесианската матрица е симетрична квадратна матрица от втори частични производни на функция в точката, в която елементите на матрицата са симетрични спрямо главния диагонал.

За да определите вида на екстремума (максимум или минимум на функция), можете да използвате правилото на Силвестър:

1. За да бъде вторият диференциал на функцията на Лагранж с положителен знак необходимо е ъгловите минори на функцията да са положителни. При такива условия функцията в тази точка има минимум.

2. За да бъде вторият диференциал на функцията на Лагранж с отрицателен знак , необходимо е ъгловите минори на функцията да се редуват, а първият елемент на матрицата трябва да е negativesv. При такива условия функцията в тази точка има максимум.

Под ъглов минор имаме предвид минора, разположен в първите k реда и k колони на оригиналната матрица.

Основното практическо значение на метода на Lagrange е, че ви позволява да преминете от условна оптимизация към безусловна оптимизация и съответно да разширите арсенала от налични методи за решаване на проблема. Въпреки това, проблемът за решаване на системата от уравнения, до които се свежда този метод, в общия случай не е по-прост първоначален проблемтърсене на екстремум. Такива методи се наричат ​​индиректни. Използването им се обяснява с необходимостта да се получи решение на екстремален проблем в аналитична форма (например за определени теоретични изчисления). При решаването на конкретни практически проблеми обикновено се използват директни методи, базирани на итеративни процеси на изчисляване и сравняване на стойностите на оптимизираните функции.

Метод на изчисление

1 стъпка: Определяме функцията на Лагранж от дадената целева функция и система от ограничения:

Напред

За да добавите коментар към статията, моля, регистрирайте се на сайта.

Първо, нека разгледаме случая на функция на две променливи. Условният екстремум на функция $z=f(x,y)$ в точка $M_0(x_0;y_0)$ е екстремумът на тази функция, постигнат при условие, че променливите $x$ и $y$ в околностите на тази точка отговарят на уравнението за връзка $\ varphi (x,y)=0$.

Името „условен“ екстремум се дължи на факта, че върху променливите е наложено допълнително условие $\varphi(x,y)=0$. Ако една променлива може да бъде изразена от уравнението на връзката чрез друга, тогава проблемът за определяне на условния екстремум се свежда до проблема за определяне на обичайния екстремум на функция на една променлива. Например, ако уравнението на връзката предполага $y=\psi(x)$, тогава замествайки $y=\psi(x)$ в $z=f(x,y)$, получаваме функция на една променлива $z =f\left (x,\psi(x)\right)$. В общия случай обаче този метод е малко полезен, така че се налага въвеждането на нов алгоритъм.

Метод на умножителя на Лагранж за функции на две променливи.

Методът на умножителя на Лагранж се състои от конструиране на функция на Лагранж за намиране на условен екстремум: $F(x,y)=f(x,y)+\lambda\varphi(x,y)$ (параметърът $\lambda$ се нарича множител на Лагранж). Необходимите условия за екстремума се определят от система от уравнения, от които се определят стационарните точки:

$$ \left \( \begin(aligned) & \frac(\partial F)(\partial x)=0;\\ & \frac(\partial F)(\partial y)=0;\\ & \varphi (x,y)=0. \end(aligned) \right. $$

Достатъчно условие, от което може да се определи естеството на екстремума, е знакът $d^2 F=F_(xx)^("")dx^2+2F_(xy)^("")dxdy+F_(yy) ^("" )dy^2$. Ако в стационарна точка $d^2F > 0$, тогава функцията $z=f(x,y)$ има условен минимум в тази точка, но ако $d^2F< 0$, то условный максимум.

Има и друг начин да се определи естеството на екстремума. От уравнението на свързване получаваме: $\varphi_(x)^(")dx+\varphi_(y)^(")dy=0$, $dy=-\frac(\varphi_(x)^("))( \varphi_ (y)^("))dx$, следователно във всяка неподвижна точка имаме:

$$d^2 F=F_(xx)^("")dx^2+2F_(xy)^("")dxdy+F_(yy)^("")dy^2=F_(xx)^( "")dx^2+2F_(xy)^("")dx\left(-\frac(\varphi_(x)^("))(\varphi_(y)^("))dx\right)+ F_(yy)^("")\left(-\frac(\varphi_(x)^("))(\varphi_(y)^("))dx\right)^2=\\ =-\frac (dx^2)(\left(\varphi_(y)^(") \right)^2)\cdot\left(-(\varphi_(y)^("))^2 F_(xx)^(" ")+2\varphi_(x)^(")\varphi_(y)^(")F_(xy)^("")-(\varphi_(x)^("))^2 F_(yy)^ ("") \вдясно)$$

Вторият фактор (разположен в скоби) може да бъде представен в следната форма:

Елементите на детерминантата $\left| са маркирани в червено. \begin(масив) (cc) F_(xx)^("") & F_(xy)^("") \\ F_(xy)^("") & F_(yy)^("") \end (масив)\right|$, което е хесианът на функцията на Лагранж. Ако $H > 0$, тогава $d^2F< 0$, что указывает на условный максимум. Аналогично, при $H < 0$ имеем $d^2F >0$, т.е. имаме условен минимум на функцията $z=f(x,y)$.

Бележка относно записа на детерминанта $H$. Покажи скрий

$$ H=-\left|\begin(array) (ccc) 0 & \varphi_(x)^(") & \varphi_(y)^(")\\ \varphi_(x)^(") & F_ (xx)^("") & F_(xy)^("") \\ \varphi_(y)^(") & F_(xy)^("") & F_(yy)^("") \ край (масив) \right| $$

В тази ситуация правилото, формулирано по-горе, ще се промени, както следва: ако $H > 0$, тогава функцията има условен минимум и ако $H< 0$ получим условный максимум функции $z=f(x,y)$. При решении задач следует учитывать такие нюансы.

Алгоритъм за изследване на функция на две променливи за условен екстремум

  1. Съставете функцията на Лагранж $F(x,y)=f(x,y)+\lambda\varphi(x,y)$
  2. Решете системата $ \left \( \begin(aligned) & \frac(\partial F)(\partial x)=0;\\ & \frac(\partial F)(\partial y)=0;\\ & \ varphi (x,y)=0. \end(aligned) \right.$
  3. Определете естеството на екстремума във всяка от стационарните точки, намерени в предходния параграф. За да направите това, използвайте някой от следните методи:
    • Съставете детерминантата на $H$ и намерете знака му
    • Като вземете предвид уравнението за свързване, изчислете знака на $d^2F$

Метод на множителя на Лагранж за функции на n променливи

Да кажем, че имаме функция от $n$ променливи $z=f(x_1,x_2,\ldots,x_n)$ и $m$ уравнения за свързване ($n > m$):

$$\varphi_1(x_1,x_2,\ldots,x_n)=0; \; \varphi_2(x_1,x_2,\ldots,x_n)=0,\ldots,\varphi_m(x_1,x_2,\ldots,x_n)=0.$$

Означавайки множителите на Лагранж като $\lambda_1,\lambda_2,\ldots,\lambda_m$, съставяме функцията на Лагранж:

$$F(x_1,x_2,\ldots,x_n,\lambda_1,\lambda_2,\ldots,\lambda_m)=f+\lambda_1\varphi_1+\lambda_2\varphi_2+\ldots+\lambda_m\varphi_m$$

Необходимите условия за наличие на условен екстремум се дават от система от уравнения, от които се намират координатите на стационарни точки и стойностите на множителите на Лагранж:

$$\left\(\begin(aligned) & \frac(\partial F)(\partial x_i)=0; (i=\overline(1,n))\\ & \varphi_j=0; (j=\ overline(1,m)) \end(aligned) \right.$$

Можете да разберете дали функцията има условен минимум или условен максимум в намерената точка, както преди, като използвате знака $d^2F$. Ако в намерената точка $d^2F > 0$, тогава функцията има условен минимум, но ако $d^2F< 0$, - то условный максимум. Можно пойти иным путем, рассмотрев следующую матрицу:

Детерминанта на матрицата $\left| \begin(масив) (ccccc) \frac(\partial^2F)(\partial x_(1)^(2)) & \frac(\partial^2F)(\partial x_(1)\partial x_(2) ) & \frac(\partial^2F)(\partial x_(1)\partial x_(3)) &\ldots & \frac(\partial^2F)(\partial x_(1)\partial x_(n)) \\ \frac(\partial^2F)(\partial x_(2)\partial x_1) & \frac(\partial^2F)(\partial x_(2)^(2)) & \frac(\partial^2F )(\partial x_(2)\partial x_(3)) &\ldots & \frac(\partial^2F)(\partial x_(2)\partial x_(n))\\ \frac(\partial^2F )(\partial x_(3) \partial x_(1)) & \frac(\partial^2F)(\partial x_(3)\partial x_(2)) & \frac(\partial^2F)(\partial x_(3)^(2)) &\ldots & \frac(\partial^2F)(\partial x_(3)\partial x_(n))\\ \ldots & \ldots & \ldots &\ldots & \ ldots\\ \frac(\partial^2F)(\partial x_(n)\partial x_(1)) & \frac(\partial^2F)(\partial x_(n)\partial x_(2)) & \ frac(\partial^2F)(\partial x_(n)\partial x_(3)) &\ldots & \frac(\partial^2F)(\partial x_(n)^(2))\\ \end( масив) \right|$, подчертано в червено в матрицата $L$, е Хесианът на функцията на Лагранж. Използваме следното правило:

  • Ако знаците на ъгловите минори $H_(2m+1),\; H_(2m+2),\ldots,H_(m+n)$ матрици $L$ съвпадат със знака на $(-1)^m$, тогава изследваната стационарна точка е условната минимална точка на функцията $ z=f(x_1,x_2 ,x_3,\ldots,x_n)$.
  • Ако знаците на ъгловите минори $H_(2m+1),\; H_(2m+2),\ldots,H_(m+n)$ се редуват и знакът на второстепенното $H_(2m+1)$ съвпада със знака на числото $(-1)^(m+1 )$, тогава стационарната точка е условната максимална точка на функцията $z=f(x_1,x_2,x_3,\ldots,x_n)$.

Пример №1

Намерете условния екстремум на функцията $z(x,y)=x+3y$ при условие $x^2+y^2=10$.

Геометричната интерпретация на тази задача е следната: изисква се да се намерят най-голямата и най-малката стойност на апликацията на равнината $z=x+3y$ за точките на нейното пресичане с цилиндъра $x^2+y ^2=10$.

Донякъде е трудно да изразим една променлива чрез друга от уравнението за свързване и да я заместим във функцията $z(x,y)=x+3y$, така че ще използваме метода на Лагранж.

Означавайки $\varphi(x,y)=x^2+y^2-10$, съставяме функцията на Лагранж:

$$ F(x,y)=z(x,y)+\lambda \varphi(x,y)=x+3y+\lambda(x^2+y^2-10);\\ \frac(\partial F)(\partial x)=1+2\lambda x; \frac(\partial F)(\partial y)=3+2\lambda y. $$

Нека напишем система от уравнения за определяне на стационарните точки на функцията на Лагранж:

$$ \left \( \begin(aligned) & 1+2\lambda x=0;\\ & 3+2\lambda y=0;\\ & x^2+y^2-10=0. \end (подравнено)\вдясно.$$

Ако приемем $\lambda=0$, тогава първото уравнение става: $1=0$. Полученото противоречие показва, че $\lambda\neq 0$. При условието $\lambda\neq 0$, от първото и второто уравнение имаме: $x=-\frac(1)(2\lambda)$, $y=-\frac(3)(2\lambda) $. Замествайки получените стойности в третото уравнение, получаваме:

$$ \left(-\frac(1)(2\lambda) \right)^2+\left(-\frac(3)(2\lambda) \right)^2-10=0;\\ \frac (1)(4\lambda^2)+\frac(9)(4\lambda^2)=10; \lambda^2=\frac(1)(4); \left[ \begin(aligned) & \lambda_1=-\frac(1)(2);\\ & \lambda_2=\frac(1)(2). \end(aligned) \right.\\ \begin(aligned) & \lambda_1=-\frac(1)(2); \; x_1=-\frac(1)(2\lambda_1)=1; \; y_1=-\frac(3)(2\lambda_1)=3;\\ & \lambda_2=\frac(1)(2); \; x_2=-\frac(1)(2\lambda_2)=-1; \; y_2=-\frac(3)(2\lambda_2)=-3.\край (подравнено) $$

И така, системата има две решения: $x_1=1;\; y_1=3;\; \lambda_1=-\frac(1)(2)$ и $x_2=-1;\; y_2=-3;\; \lambda_2=\frac(1)(2)$. Нека разберем природата на екстремума във всяка стационарна точка: $M_1(1;3)$ и $M_2(-1;-3)$. За да направим това, ние изчисляваме детерминантата на $H$ във всяка точка.

$$ \varphi_(x)^(")=2x;\; \varphi_(y)^(")=2y;\; F_(xx)^("")=2\ламбда;\; F_(xy)^("")=0;\; F_(yy)^("")=2\lambda.\\ H=\left| \begin(array) (ccc) 0 & \varphi_(x)^(") & \varphi_(y)^(")\\ \varphi_(x)^(") & F_(xx)^("") & F_(xy)^("") \\ \varphi_(y)^(") & F_(xy)^("") & F_(yy)^("") \end(array) \right|= \ляво| \begin(масив) (ccc) 0 & 2x & 2y\\ 2x & 2\lambda & 0 \\ 2y & 0 & 2\lambda \end(масив) \right|= 8\cdot\left| \begin(масив) (ccc) 0 & x & y\\ x & \lambda & 0 \\ y & 0 & \lambda \end(масив) \right| $$

В точка $M_1(1;3)$ получаваме: $H=8\cdot\left| \begin(масив) (ccc) 0 & x & y\\ x & \lambda & 0 \\ y & 0 & \lambda \end(масив) \right|= 8\cdot\left| \begin(array) (ccc) 0 & 1 & 3\\ 1 & -1/2 & 0 \\ 3 & 0 & -1/2 \end(array) \right|=40 > 0$, така че при точка $M_1(1;3)$ функцията $z(x,y)=x+3y$ има условен максимум, $z_(\max)=z(1;3)=10$.

По същия начин в точка $M_2(-1,-3)$ намираме: $H=8\cdot\left| \begin(масив) (ccc) 0 & x & y\\ x & \lambda & 0 \\ y & 0 & \lambda \end(масив) \right|= 8\cdot\left| \begin(array) (ccc) 0 & -1 & -3\\ -1 & 1/2 & 0 \\ -3 & 0 & 1/2 \end(array) \right|=-40$. От $H< 0$, то в точке $M_2(-1;-3)$ имеем условный минимум функции $z(x,y)=x+3y$, а именно: $z_{\min}=z(-1;-3)=-10$.

Отбелязвам, че вместо да се изчислява стойността на детерминантата $H$ във всяка точка, е много по-удобно да се разшири в общ вид. За да не претрупвам текста с подробности, ще скрия този метод под бележка.

Записване на детерминантата $H$ в общ вид. Покажи скрий

$$ H=8\cdot\left|\begin(array)(ccc)0&x&y\\x&\lambda&0\\y&0&\lambda\end(array)\right| =8\cdot\left(-\lambda(y^2)-\lambda(x^2)\right) =-8\lambda\cdot\left(y^2+x^2\right). $$

По принцип вече е очевидно какъв знак има $H$. Тъй като нито една от точките $M_1$ или $M_2$ не съвпада с началото, то $y^2+x^2>0$. Следователно знакът на $H$ е противоположен на знака на $\lambda$. Можете да завършите изчисленията:

$$ \begin(aligned) &H(M_1)=-8\cdot\left(-\frac(1)(2)\right)\cdot\left(3^2+1^2\right)=40;\ \ &H(M_2)=-8\cdot\frac(1)(2)\cdot\left((-3)^2+(-1)^2\right)=-40. \end(подравнено) $$

Въпросът за природата на екстремума в стационарните точки $M_1(1;3)$ и $M_2(-1;-3)$ може да бъде решен без използване на детерминантата $H$. Нека намерим знака на $d^2F$ във всяка неподвижна точка:

$$ d^2 F=F_(xx)^("")dx^2+2F_(xy)^("")dxdy+F_(yy)^("")dy^2=2\lambda \left( dx^2+dy^2\right) $$

Нека отбележа, че записът $dx^2$ означава точно $dx$, повдигнат на втора степен, т.е. $\left(dx \right)^2$. Следователно имаме: $dx^2+dy^2>0$, следователно с $\lambda_1=-\frac(1)(2)$ получаваме $d^2F< 0$. Следовательно, функция имеет в точке $M_1(1;3)$ условный максимум. Аналогично, в точке $M_2(-1;-3)$ получим условный минимум функции $z(x,y)=x+3y$. Отметим, что для определения знака $d^2F$ не пришлось учитывать связь между $dx$ и $dy$, ибо знак $d^2F$ очевиден без дополнительных преобразований. В следующем примере для определения знака $d^2F$ уже будет необходимо учесть связь между $dx$ и $dy$.

Отговор: в точка $(-1;-3)$ функцията има условен минимум, $z_(\min)=-10$. В точка $(1;3)$ функцията има условен максимум, $z_(\max)=10$

Пример №2

Намерете условния екстремум на функцията $z(x,y)=3y^3+4x^2-xy$ при условие $x+y=0$.

Първи метод (метод на умножителя на Лагранж)

Означавайки $\varphi(x,y)=x+y$, съставяме функцията на Лагранж: $F(x,y)=z(x,y)+\lambda \varphi(x,y)=3y^3+ 4x^2 -xy+\lambda(x+y)$.

$$ \frac(\partial F)(\partial x)=8x-y+\lambda; \; \frac(\partial F)(\partial y)=9y^2-x+\lambda.\\ \left \( \begin(aligned) & 8x-y+\lambda=0;\\ & 9y^2-x+\ ламбда=0; \\ & x+y=0. \end(подравнено) \right. $$

След като решихме системата, получаваме: $x_1=0$, $y_1=0$, $\lambda_1=0$ и $x_2=\frac(10)(9)$, $y_2=-\frac(10)( 9)$ , $\lambda_2=-10$. Имаме две стационарни точки: $M_1(0;0)$ и $M_2 \left(\frac(10)(9);-\frac(10)(9) \right)$. Нека открием природата на екстремума във всяка стационарна точка, като използваме детерминантата $H$.

$$H=\ляво| \begin(array) (ccc) 0 & \varphi_(x)^(") & \varphi_(y)^(")\\ \varphi_(x)^(") & F_(xx)^("") & F_(xy)^("") \\ \varphi_(y)^(") & F_(xy)^("") & F_(yy)^("") \end(array) \right|= \ляво| \begin(масив) (ccc) 0 & 1 & 1\\ 1 & 8 & -1 \\ 1 & -1 & 18y \end(масив) \right|=-10-18y $$

В точка $M_1(0;0)$ $H=-10-18\cdot 0=-10< 0$, поэтому $M_1(0;0)$ есть точка условного минимума функции $z(x,y)=3y^3+4x^2-xy$, $z_{\min}=0$. В точке $M_2\left(\frac{10}{9};-\frac{10}{9}\right)$ $H=10 >0$, следователно в тази точка функцията има условен максимум, $z_(\max)=\frac(500)(243)$.

Ние изследваме природата на екстремума във всяка точка, използвайки различен метод, базиран на знака на $d^2F$:

$$ d^2 F=F_(xx)^("")dx^2+2F_(xy)^("")dxdy+F_(yy)^("")dy^2=8dx^2-2dxdy+ 18ydy ^2 $$

От уравнението на връзката $x+y=0$ имаме: $d(x+y)=0$, $dx+dy=0$, $dy=-dx$.

$$ d^2 F=8dx^2-2dxdy+18ydy^2=8dx^2-2dx(-dx)+18y(-dx)^2=(10+18y)dx^2 $$

Тъй като $ d^2F \Bigr|_(M_1)=10 dx^2 > 0$, тогава $M_1(0;0)$ е условната минимална точка на функцията $z(x,y)=3y^3+ 4x^ 2-xy$. По същия начин $d^2F \Bigr|_(M_2)=-10 dx^2< 0$, т.е. $M_2\left(\frac{10}{9}; -\frac{10}{9} \right)$ - точка условного максимума.

Втори начин

От уравнението на връзката $x+y=0$ получаваме: $y=-x$. Замествайки $y=-x$ във функцията $z(x,y)=3y^3+4x^2-xy$, получаваме някаква функция на променливата $x$. Нека означим тази функция като $u(x)$:

$$ u(x)=z(x,-x)=3\cdot(-x)^3+4x^2-x\cdot(-x)=-3x^3+5x^2. $$

Така сведохме проблема за намиране на условния екстремум на функция на две променливи до проблема за определяне на екстремума на функция на една променлива.

$$ u_(x)^(")=-9x^2+10x;\\ -9x^2+10x=0; \; x\cdot(-9x+10)=0;\\ x_1=0; \ ; y_1=-x_1=0;\\ x_2=\frac(10)(9);\; y_2=-x_2=-\frac(10)(9). $$

Получихме точки $M_1(0;0)$ и $M_2\left(\frac(10)(9); -\frac(10)(9)\right)$. Допълнителни изследвания са известни от курса на диференциалното смятане на функциите на една променлива. Като изследваме знака на $u_(xx)^("")$ във всяка неподвижна точка или проверяваме промяната в знака на $u_(x)^(")$ в намерените точки, получаваме същите заключения, както когато решаване на първия метод. Например ще проверим знака $u_(xx)^("")$:

$$u_(xx)^("")=-18x+10;\\ u_(xx)^("")(M_1)=10;\;u_(xx)^("")(M_2)=- 10.$$

Тъй като $u_(xx)^("")(M_1)>0$, тогава $M_1$ е минималната точка на функцията $u(x)$ и $u_(\min)=u(0)=0 $ . Тъй като $u_(xx)^("")(M_2)<0$, то $M_2$ - точка максимума функции $u(x)$, причём $u_{\max}=u\left(\frac{10}{9}\right)=\frac{500}{243}$.

Стойностите на функцията $u(x)$ за дадено условие на свързване съвпадат със стойностите на функцията $z(x,y)$, т.е. намерените екстремуми на функцията $u(x)$ са търсените условни екстремуми на функцията $z(x,y)$.

Отговор: в точката $(0;0)$ функцията има условен минимум, $z_(\min)=0$. В точката $\left(\frac(10)(9); -\frac(10)(9) \right)$ функцията има условен максимум, $z_(\max)=\frac(500)(243 )$.

Нека разгледаме друг пример, в който ще изясним природата на екстремума чрез определяне на знака на $d^2F$.

Пример №3

Намерете най-голямата и най-малката стойност на функцията $z=5xy-4$, ако променливите $x$ и $y$ са положителни и удовлетворяват уравнението за свързване $\frac(x^2)(8)+\frac( y^2)(2) -1=0$.

Нека съставим функцията на Лагранж: $F=5xy-4+\lambda \left(\frac(x^2)(8)+\frac(y^2)(2)-1 \right)$. Нека намерим стационарните точки на функцията на Лагранж:

$$ F_(x)^(")=5y+\frac(\lambda x)(4); \; F_(y)^(")=5x+\lambda y.\\ \left \( \begin(aligned) & 5y+\frac(\lambda x)(4)=0;\\ & 5x+\lambda y=0;\\ & \frac(x^2)(8)+\frac(y^2)(2)- 1=0;\\ & x > 0; \;y > 0. \end(aligned) \right. $$

Всички следващи трансформации се извършват, като се вземе предвид $x > 0; \; y > 0$ (това е посочено в формулировката на проблема). От второто уравнение изразяваме $\lambda=-\frac(5x)(y)$ и заместваме намерената стойност в първото уравнение: $5y-\frac(5x)(y)\cdot \frac(x)(4 )=0$ , $4y^2-x^2=0$, $x=2y$. Като заместим $x=2y$ в третото уравнение, получаваме: $\frac(4y^2)(8)+\frac(y^2)(2)-1=0$, $y^2=1$, $y =1$.

Тъй като $y=1$, тогава $x=2$, $\lambda=-10$. Ние определяме природата на екстремума в точката $(2;1)$ въз основа на знака на $d^2F$.

$$ F_(xx)^("")=\frac(\lambda)(4); \; F_(xy)^("")=5; \; F_(yy)^("")=\ламбда. $$

Тъй като $\frac(x^2)(8)+\frac(y^2)(2)-1=0$, тогава:

$$ d\left(\frac(x^2)(8)+\frac(y^2)(2)-1\right)=0; \; d\left(\frac(x^2)(8) \right)+d\left(\frac(y^2)(2) \right)=0; \; \frac(x)(4)dx+ydy=0; \; dy=-\frac(xdx)(4y). $$

По принцип тук можете веднага да замените координатите на стационарната точка $x=2$, $y=1$ и параметъра $\lambda=-10$, получавайки:

$$ F_(xx)^("")=\frac(-5)(2); \; F_(xy)^("")=-10; \; dy=-\frac(dx)(2).\\ d^2 F=F_(xx)^("")dx^2+2F_(xy)^("")dxdy+F_(yy)^(" ")dy^2=-\frac(5)(2)dx^2+10dx\cdot \left(-\frac(dx)(2) \right)-10\cdot \left(-\frac(dx) (2) \right)^2=\\ =-\frac(5)(2)dx^2-5dx^2-\frac(5)(2)dx^2=-10dx^2. $$

Въпреки това, в други задачи на условен екстремум може да има няколко стационарни точки. В такива случаи е по-добре да представите $d^2F$ в общ вид и след това да замените координатите на всяка от намерените неподвижни точки в получения израз:

$$ d^2 F=F_(xx)^("")dx^2+2F_(xy)^("")dxdy+F_(yy)^("")dy^2=\frac(\lambda) (4)dx^2+10\cdot dx\cdot \frac(-xdx)(4y) +\lambda\cdot \left(-\frac(xdx)(4y) \right)^2=\\ =\frac (\lambda)(4)dx^2-\frac(5x)(2y)dx^2+\lambda \cdot \frac(x^2dx^2)(16y^2)=\left(\frac(\lambda )(4)-\frac(5x)(2y)+\frac(\lambda \cdot x^2)(16y^2) \right)\cdot dx^2 $$

Замествайки $x=2$, $y=1$, $\lambda=-10$, получаваме:

$$ d^2 F=\left(\frac(-10)(4)-\frac(10)(2)-\frac(10 \cdot 4)(16) \right)\cdot dx^2=- 10dx^2. $$

Тъй като $d^2F=-10\cdot dx^2< 0$, то точка $(2;1)$ есть точкой условного максимума функции $z=5xy-4$, причём $z_{\max}=10-4=6$.

Отговор: в точка $(2;1)$ функцията има условен максимум, $z_(\max)=6$.

В следващата част ще разгледаме приложението на метода на Лагранж за функции Повече ▼променливи.

Методът за определяне на условен екстремум започва с конструирането на спомагателна функция на Лагранж, която в областта на възможните решения достига максимум за същите стойности на променливите х 1 , х 2 , ..., х н , което е същото като целевата функция z . Нека задачата за определяне на условния екстремум на функцията е решена z = f(X) под ограничения φ аз ( х 1 , х 2 , ..., х н ) = 0, аз = 1, 2, ..., м , м < н

Нека съставим функция

което се нарича Функция на Лагранж. х , - постоянни фактори ( Множители на Лагранж). Обърнете внимание, че на множителите на Лагранж може да се даде икономическо значение. Ако f(x 1 , х 2 , ..., х н ) - приходи в съответствие с плана X = (x 1 , х 2 , ..., х н ) , и функцията φ аз 1 , х 2 , ..., х н ) - разходи за i-тия ресурс, съответстващ на този план, тогава х , е цената (оценката) на i-тия ресурс, характеризираща изменението на екстремната стойност на целевата функция в зависимост от изменението на размера на i-тия ресурс (пределна оценка). L(X) - функция n+m променливи 1 , х 2 , ..., х н , λ 1 , λ 2 , ..., λ н ) . Определянето на стационарните точки на тази функция води до решаване на системата от уравнения

Лесно е да се види това . По този начин задачата за намиране на условния екстремум на функцията z = f(X) се свежда до намиране на локалния екстремум на функцията L(X) . Ако се намери стационарна точка, тогава въпросът за съществуването на екстремум в най-простите случаи се решава въз основа на достатъчни условия за екстремума - изучаване на знака на втория диференциал д 2 L(X) в стационарна точка, при условие че променливата нараства Δx аз - свързани с връзки

получен чрез диференциране на уравненията на свързване.

Решаване на система от нелинейни уравнения с две неизвестни чрез инструмента Find Solution

Настройки Намиране на решениеви позволява да намерите решение на система от нелинейни уравнения с две неизвестни:

Където
- нелинейна функция на променливи х И г ,
- произволна константа.

Известно е, че двойката ( х , г ) е решение на система от уравнения (10) тогава и само ако е решение на следното уравнение с две неизвестни:

СЪСот друга страна, решението на система (10) е пресечните точки на две криви: f ] (х, г) = ° С И f 2 (x, y) = C 2 на повърхността XOY.

Това води до метод за намиране на корените на системата. нелинейни уравнения:

    Определете (поне приблизително) интервала на съществуване на решение на системата от уравнения (10) или уравнение (11). Тук е необходимо да се вземе предвид вида на уравненията, включени в системата, областта на дефиниране на всяко от техните уравнения и т.н. Понякога се използва избор на първоначално приближение на решението;

    Табулирайте решението на уравнение (11) за променливите x и y на избрания интервал или изградете графики на функции f 1 (х, г) = C, и f 2 (x,y) = C 2 (система (10)).

    Локализирайте предполагаемите корени на система от уравнения – намерете няколко минимални стойностиот таблицата, таблицирайте корените на уравнение (11) или определете пресечните точки на кривите, включени в системата (10).

4. Намерете корените на системата от уравнения (10) с помощта на добавката Намиране на решение.

Помислете за ограничен оптимизационен проблем, съдържащ само ограничения под формата на равенства

мин

предмет на ограничения

,
.

Този проблем по принцип може да бъде решен като неограничен оптимизационен проблем, получен чрез елиминиране на m независими променливи от целевата функция, като се използват дадени равенства. Наличието на ограничения под формата на равенства всъщност прави възможно намаляването на размерността на първоначалния проблем. Новият проблем може да бъде решен с помощта на подходящ неограничен метод за оптимизация.

Пример. Необходимо е да се минимизира функцията

когато е ограничен

Чрез изключване на променливата използвайки уравнението, получаваме оптимизационен проблем с две променливи без ограничения:

минимизиране,

които могат да бъдат решени с помощта на един от методите за безусловна оптимизация.

Методът на елиминиране на променливите обаче е приложим само в случаите, когато уравненията, представляващи ограниченията, могат да бъдат решени по отношение на определен набор от променливи. Ако има голям брой ограничения под формата на равенства, процесът на елиминиране на променливите се превръща в много трудоемка процедура. Освен това може да има ситуации, при които уравнението не може да бъде решено по отношение на променлива. В този случай е препоръчително да използвате метода на умножителя на Лагранж.

Използвайки метода на умножителя на Лагранж, по същество се установяват необходимите условия, за да се позволи идентифицирането на оптимални точки в оптимизационни проблеми с ограничения на равенството.

Нека разгледаме проблема

мин

предмет на ограничения

,
.

От курса математически анализдобре известно е, че условната минимална точка на функцията съвпада със седловата точка на функцията на Лагранж:

,

в този случай седловата точка трябва да осигурява минимум по отношение на променливите и максимални параметри . Тези параметри се наричат ​​множители на Лагранж. Приравняване на частни производни на функции от и от до нула, получаваме необходимите условиянеподвижна точка:

,
,

,
.

Системно решение
уравнения определя стационарната точка на функцията на Лагранж. Достатъчните условия за съществуването на минимум от първоначалния проблем съдържат, в допълнение към споменатите по-горе, положителната определеност на матрицата на Хесиан на целевата функция.

4.2. Условия на Coon-tucker

Нека разгледаме проблем с нелинейно програмиране с ограничения под формата на неравенства

мин

под ограничения

,
.

Нека намалим ограниченията под формата на неравенства до ограничения за равенство, като добавим отслабващи променливи към всяко от тях ,
:



.

Нека формираме функцията на Лагранж:

Тогава се оформят необходимите условия за минимум

,
;

,
;

,
.

Можете да умножите последното уравнение по и заменете отслабващите променливи, като ги изразите от второто уравнение. Второто уравнение може да се трансформира чрез отхвърляне на отслабващите променливи и преминаване към ограничения на неравенството. Трябва да се добави още едно условие
, която трябва да бъде изпълнена в условната минимална точка.

Накрая получаваме необходимите условия за съществуването на минимум проблем с нелинейно програмиране с ограничения на неравенството, които се наричат ​​условия на Kuhn-Tucker:

,
; (1)

,
; (2)

,
; (3)

,
. (4)

Ограничение на неравенството
наречен активен в точка , ако се превърне в равенство
, и се нарича неактивен, ако
. Ако е възможно да се открият, преди директно решаване на проблема, ограничения, които са неактивни в оптималната точка, тогава тези ограничения могат да бъдат изключени от модела и по този начин да се намали неговият размер.

Уравнение (3) означава, че или
, или
. Ако
, Че
и ограничението е активно и представлява ограничение за равенство. От друга страна, ако ограничението е строго неравенство
, тогава множителят на Лагранж ще има формата
тези. ограничение
е неактивен и може да бъде игнориран. Разбира се, не е известно предварително какви ограничения могат да бъдат пренебрегнати.