Caderno 9 - Laboratório Virtual de Métodos Numéricos (LAVIME)

Método de Newton para sistemas não-lineares¶

Este método determina, a cada iteração, a solução aproximada do sistema não-linear através de uma linearização das funções-alvo com a matriz Jacobiana associada ao sistema.

Passos¶

Para o método de Newton não-linear, basicamente criamos uma espécie de “caminho” onde somamos um vetor de deslocamento ${\bf s}$ às aproximações sucessivas que dá a direção para onde os vetores devem prosseguir a fim de atingir convergência.

Obs.: este processo iterativo usa critérios de parada naturais em algoritmos iterativos.

Para encontrarmos o vetor solução, devemos resolver a equação matricial linearizada

{\bf J}({\bf x}^{(i)}){\bf s}^{(i)} = - {\bf F}({\bf x}^{(i)})

(1)

Em seguida, atualizamos o novo vetor da sequencia como:

{\bf x}^{(i+1)}={\bf x}^{(i)} + {\bf s}^{(i)}.

(2)

Acima, ${\bf J}({\bf x}^{(i)})$ é a matriz Jacobiana formada a partir das derivadas parciais das funções componentes do vetor ${\bf F}$ .

No caso de um sistema em que ${\bf F} = [f_1(x_1,x_2) \ \ f_2(x_1,x_2)]^T$ , teríamos o sistema abaixo:

\begin{bmatrix} \frac{\partial f_1(x_1,x_2)}{\partial x_1} & \frac{\partial f_1(x_1,x_2)}{\partial x_2} \\ \frac{\partial f_2(x_1,x_2)}{\partial x_1} & \frac{\partial f_2(x_1,x_2)}{\partial x_2} \\ \end{bmatrix} \begin{bmatrix} s_0 \\ s_1 \\ \end{bmatrix} = \begin{bmatrix} -f_1(x_1,x_2)\\ -f_2(x_1,x_2) \\ \end{bmatrix}

(3)

%matplotlib inline
import numpy as np
import matplotlib.pyplot as plt
import sympy as sy
from scipy.optimize import root

No exemplo a seguir, mostramos como podemos resolver um sistema de equações não-lineares usando o scipy.

Procuramos as soluções para o sistema não-linear

\begin{cases}f_1(x,y) &: x^2 + y^2 = 2 \\ f_2(x,y) &: x^2 - \frac{y^2}{9} = 1\end{cases}

(4)

Vamos plotar o gráficos das funções:

x = np.linspace(-2,2,50,endpoint=True)
y = x[:]
X,Y = np.meshgrid(x,y)

# define funções para plotagem
F1 = X**2 + Y**2 - 2
F2 = X**2 - Y**2/9 - 1

# curvas de nível
C = plt.contour(X,Y,F1,levels=[0],colors='k')
C = plt.contour(X,Y,F2,levels=[0],colors='g')
plt.grid(True)

Pela figura, vemos que existem 4 pontos de interseção entre as curvas e, portanto, 4 soluções, as quais formam o conjunto

S = \{(x_1^{*},y_1^{*}),(x_2^{*},y_2^{*}),(x_3^{*},y_3^{*}),(x_4^{*},y_4^{*}))

(5)

Agora, vamos usar a função root do scipy para computar essas soluções com base em estimativas iniciais.

# define função para o vetor F(x)
def F(x):
    return [ x[0]**2 + x[1]**2 - 2,
             x[0]**2 - x[1]**2/9 - 1 ]


x,y = sy.symbols('x,y')

# usa computação simbólica para determinar a matriz Jacobiana
f1 = x**2 + y**2 - 2
f2 = x**2 - y**2/9 - 1

# gradientes

f1x,f1y = sy.diff(f1,x),sy.diff(f1,y)
f2x,f2y = sy.diff(f2,x),sy.diff(f2,y)

# imprime derivadas parciais
print(f1x)
print(f1y)
print(f2x)
print(f2y)

# monta matriz Jacobiana
def jacobian(x):
    return np.array([[2*x[0], 2*x[1]], [2*x[0],-2*x[1]/9]])

# resolve o sistema não-linear por algoritmo de Levenberg-Marqardt modificado

inicial = [[2,2],[-2,2],[-2,-2],[2,-2]]

S = []
i = 1
for vetor in inicial: 
    aux = root(F,vetor,jac=jacobian, method='lm')
    S.append(aux.x) 
    s = 'Solução x({0})* encontrada: {1}'
    print(s.format(i,aux.x))
    i +=1

2*x
2*y
2*x
-2*y/9
Solução x(1)* encontrada: [1.04880885 0.9486833 ]
Solução x(2)* encontrada: [-1.04880885  0.9486833 ]
Solução x(3)* encontrada: [-1.04880885 -0.9486833 ]
Solução x(4)* encontrada: [ 1.04880885 -0.9486833 ]

Em seguida, vamos plotar as soluções e as curvas

# curvas de nível
C = plt.contour(X,Y,F1,levels=[0],colors='k')
C = plt.contour(X,Y,F2,levels=[0],colors='g')
plt.grid(True)

# imprime interseções
for i in range(len(S)):
        plt.plot(S[i][0],S[i][1],'or')

Exercício:¶

Resolva os sistemas não-lineares da Lista de Exercícios 4 usando a mesma abordagem acima.

Nota: Raízes de sistemas não-lineares¶

Uma equação linear tem a forma:

f(x) = a_1 x_1 + a_2 x_2 + \ldots + a_n x_n

(6)

Uma equação não-linear possui “produtos de incógnitas”, e.g.

f_2(x) = a_1 x_1 x_2 + a_2 x_2^2 + a_n x_nx_1

(7)

Um sistema de equações não-lineares é composto de várias equações não-lineares

f_1(x_1,x_2,\ldots,x_n) = 0

(8)

f_2(x_1,x_2,\ldots,x_n) = 0

(9)

\vdots

(10)

f_n(x_1,x_2,\ldots,x_n) = 0

(11)

A solução do sistema é o vetor $(x_1^{*},x_2^{*},\ldots,x_n^{*})$ que satisfaz as $n$ equações simultaneamente.

Iteração de Ponto Fixo para sistemas não-lineares¶

Aplicar o algoritmo iterativo em cada componente:

x_1^{i+1} = \tilde{f}_1(x_1^{i},x_2^{i},\ldots,x_n^{i})

(12)

x_2^{i+1} = \tilde{f}_2(x_1^{i},x_2^{i},\ldots,x_n^{i})

(13)

\vdots

(14)

x_3^{i+1} = \tilde{f}_3(x_1^{i},x_2^{i},\ldots,x_n^{i})

(15)

As formas funcionais mudam porque devemos isolar a variável $x_i$ .

Exemplo: encontrar a raiz do sistema abaixo:

f_1(x,y) = x^2 + xy - 10 = 0

(16)

f_2(x,y) = y + 3xy^2 - 57 = 0

(17)

Solução:

Reescrevamos as equações na forma

x = \tilde{f}_1(x,y) = \sqrt{10 - xy}

(18)

y = \tilde{f}_2(x,y) = \sqrt{\frac{57-y}{3x}}

(19)

de onde temos a iteração de ponto fixo dada por

x^{i+1} = \sqrt{10 - x^iy^i}

(20)

y^{i+1} = \sqrt{\frac{57-y^i}{3x^i}}, \quad i = 0,1,2,\ldots,

(21)

Usando $(x^0,y^0) = (1.5,3.5)$ como “chute” inicial, computamos

x^{1} = \sqrt{10 - x^0y^0} = \sqrt{10 - 1.5(3.5)} = 2.17945

(22)

y^{1} = \sqrt{\frac{57-y^0}{3x^1}} = \sqrt{\frac{57-3.5}{3(2.17945)}} = 2.86051

(23)

(o valor de $x^1$ pode ser usado diretamente em vez de $x^0$ .)

x^{2} = \sqrt{10 - x^1y^1} = \sqrt{10 - 2.17945(2.86051)} = 1.94053

(24)

y^{2} = \sqrt{\frac{57-y^1}{3x^2}} = \sqrt{\frac{57-2.86051}{3(1.94053)}} = 3.04955

(25)

\ldots

(26)

O processo iterativo converge para a solução $(x^{*},y^{*}) = (2,3)$ .

Notas:

A convergência por iteração de PF depende de como as equações $\tilde{f}_1,\tilde{f}_2,\ldots,\tilde{f}_n$ são formuladas, bem como de um bom “chute” inicial.
A iteração de PF é bastante restritiva nas soluções de sistemas não-lineares.