Seja um espaço vetorialn-dimensional; seja uma transformação linear em Predefinição:Math, o conjunto de todas as transformações lineares de sobre si mesmo; e seja a representação matricial de em relação a alguma base ordenada.
Um autovetor generalizado correspondendo a , juntamente com a matriz , gera uma cadeia de Jordan de autovetores generalizados linearmente independentes que formam uma base para um subespaço invariante de .[5][6][7]
Usando autovetores generalizados, um conjunto de autovetores linearmente independentes de pode ser estendido para uma base completa para .[8] Esta base pode ser usada para determinar uma matriz quasi-diagonal em forma canônica de Jordan, semelhante a , que é de uso prático no cálculo de certas funções matriciais de .[1] A matriz é também útil na solução de sistemas de equações diferenciais ordinárias onde não precisa ser diagonalizável.[3][9]
Existem diversas formas equivalentes de definir um autovetor ordinário.[10][11][12][13][14][15][16][17] Para nossos propósito aqui, um autovetor associado com um autovalor de uma matriz de ordem × é um vetor não nulo para o qual , sendo a matriz identidade × e o vetor nulo de ordem .[12] Isto é, é o núcleo da transformação linear. Se tem autovetores linearmente independentes, então é similar a uma matriz diagonal . Isto é, existe uma matriz inversível tal que é diagonalizável através da transformação similar .[18][19] A matriz é denominada matriz espectral de . A matriz é denominada matriz modal de .[20] Matrizes diagonalizáveis são de particular interesse, por funções matriciais poderem ser facilmente computadas.[21]
De outro modo, se não tem autovetores linearmente independentes associados, então não é diagonalizável.[18][19]
Definição: Um vetor é um autovetor generalizado de grau m da matriz e correspondente ao autovalor se
Claramente, um autovetor generalizado de grau 1 é um autovetor ordinário.[22] Toda matriz × tem autovetores generalizados linearmente independentes associados a ela e pode ser mostrado ser similar a uma matriz "quase diagonal" na forma normal de Jordan.[23] Isto é, existe uma matriz inversível tal que .[24] A matriz neste caso é denominada uma matriz modal generalizada de .[25] Se é um autovalor de multiplicidade algébrica , então terá autovetores generalizados linearmente independentes correspondendo a .[8] Este resultado, por sua vez, fornece um método direto para o cálculo de funções matriciais de .[26]
Predefinição:AnchorNota: Para uma matriz de ordem sobre um corpo poder ser expressa na forma normal de Jordan, todos os autovalores de devem estar em . Isto é, o polinômio característico deve ser fatorado completamente em fatores lineares. Por exemplo, se tem elementos pertencentes ao conjunto dos números reais, então pode ser necessário que os autovalores e as componentes dos autovetores tenham valores complexos.[3][4][27]
O conjunto gerado por todos os autovetores generalizados para um dado forma o autoespaço generalizado para .[3]
Exemplos
Aqui estão alguns exemplos para ilustrar o conceito de autovetores generalizados. Alguns dos detalhes são descritos depois.
Exemplo 1
Este exemplo é simples mas ilustra claramente o problema. Este tipo de matriz é usado frequentemente em livros-texto.[2][3][28]
Seja
Então existe apenas um autovalor, , sendo sua multiplicidade algébrica m = 2.
Note que esta matriz está na forma normal de Jordan, mas não é diagonal. Portanto, esta matriz não é diagonalizável. Como há uma superdiagonal, existe um autovetor generalizado de ordem maior que 1 (ou pode-se notar que o espaço vetorial é de dimensão 2, devendo assim existir no mínimo um autovetor generalizado de grau maior que 1). Alternativamente, pode ser computada a dimensão do núcleo (espaço nulo) de como sendo p = 1, e assim existem m – p = 1 autovetores generalizados de grau maior que 1.
O autovetor ordinário é computado da forma usual. Usando este autovetor é computado o autovetor generalizado resolvendo
Explicitando os valores:
Isto se simplifica como
O elemento não tem restrições. O autovetor generalizado de grau 2 é então , onde a pode assumir qualquer valor escalar. A escolha a = 0 é usualmente a mais simples.
Note que
tal que é um autovetor generalizado,
tal que é um autovetor ordinário, e que e são linearmente independentes e constituem assim uma base para o espaço vetorial .
Exemplo 2
Este exemplo é mais elaborado que o Exemplo 1. Infelizmente é dificultoso elaborar um exemplo interessante de baixa ordem.[29]
A matriz
tem autovalores e com multiplicidades algébricas e , mas multiplicidades geométricas e .
Os autoespaços generalizados de são calculados abaixo.
é o autovetor ordinário associado com .
é um autovetor generalizado associado com .
é o autovetor ordinário associado com .
e são autovetores generalizados associados com .
Isto resulta em uma base para cada um dos autoespaços generalizados de . Juntamente as duas cadeias de autovetores generalizados cobrem o espaço de todo os vetores colunas 5-dimensionais.
Uma matriz "quasi-diagonal" na forma normal de Jordan, similar a é obtida como segue:
O vetor , dado pela Eq. (Predefinição:EquationNote), é um autovetor generalizado de grau j correspondente ao autovalor . Uma cadeia e um conjunto linearmente independente de vetores.[6]
Base canônica
Predefinição:Artigo principalDefinição: Um conjunto de n autovetores generalizados linearmente independentes é uma base canônica se for composto inteiramente de cadeias de Jordan.
Thus, once we have determined that a generalized eigenvector of rank m is in a canonical basis, it follows that the m − 1 vectors that are in the Jordan chain generated by are also in the canonical basis.[31]
Let be an eigenvalue of of algebraic multiplicity . First, find the ranks (matrix ranks) of the matrices . The integer is determined to be the first integer for which has rank (n being the number of rows or columns of , that is, is n × n).
Now define
The variable designates the number of linearly independent generalized eigenvectors of rank k corresponding to the eigenvalue that will appear in a canonical basis for . Note that
Nas seções precedentes vimos técnicas para obter n autovetores generalizados linearmente independentes de uma base canônica para o espaço vetorial associado com uma matriz n × n. Estas técnicas podem ser combinadas em um procedimento:
Resolva a equação característica de para os autovalores e suas multiplicidades algébricas ;
Para cada
Determine ;
Determine ;
Determine para ;
Determine cada cadeia de Jordan para .
Examplo 3
A matriz
tem um autovalor de multiplicidade algébrica e um autovalor de multiplicidade algébrica . Temos n = 4. Para temos .
O primeiro inteiro para o qual tem posto é .
Definimos agora
Consequentemente, existem três autovetores generalizados linearmente independentes; cada qual de postos 3, 2 a 1. Como corresponde a uma simples cadeia de três autovetores generalizados linearmente independentes, sabemos que existe um autovetor generalizado de posto 3 correspondente a tal que
como um autovetor generalizado de posto 3 correspondente a . Note que é possível obter infinitos outros autovetores generalizados de posto 3 escolhendo diferentes valores de , e , com . Nossa primeira escolha, contudo, é a mais simples.[33]
Agora usando as equações (Predefinição:EquationNote), obtemos e como autovetores generalizados de postos 2 e 1 respectivamente,onde
e
O autovalor simples pode ser tratado usando técnicas padrão e tem um autovetor ordinário
Uma base canônica para é
e são autovetores generalizados associados com .
é o autovetor ordinário associado com .
Deve ser notado que este é um exemplo simples. Em geral, os números de autovetores generalizados linearmente independentes de posto k não serão sempre iguais. Isto é, pode haver diversas cadeias de comprimentos diferentes correspondentes a um particular autovalor.[34]
Matriz modal generalizada
Seja uma matriz n × n. Uma matriz modal generalizada para é uma matriz n × n cujas colunas, consideradas como vetores, forma uma base canônica para e aparece em de acordo com as seguintes regras:
Todas as cadeias de Jordan consistindo de um vetor (isto, um vetor no comprimento) aparece nas primeiras colunas de .
Todos os vetores de uma cadeia aparecem juntos em colunas adjacentes de .
Cada cadeia aparece em na ordem de posto crescente (isto é, o autovetor generalizado de posto 1 aparece antes do autovetor generalizado de posto 2 da mesma cadeia, que aparece antes do autovetor generalizado de posto 3 da mesma cadeia, etc.).[35]
Forma canônica de Jordan
Um exemplo de uma matriz na forma canônica de Jordan. Os blocos cinza são chamados de blocos de Jordan.
Predefinição:Main
Seja um espaço vetorial n-dimensional; seja um mapeamento linear em Predefinição:Math, o conjunto de todos os mapeamentos lineares de nele mesmo; e seja a representação matricial de em relação a alguma base ordenada. Pode ser mostrado que se o polinômio característico de é fatorado em fatores lineares, tal que tem a forma
onde são os distintos autovalores de , então cada é a multiplicidade algébrica de seu correspondente autovalor e é similar a uma matriz na forma canônica de Jordan, onde cada aparece vezes consecutivas na diagonal principal, e cada componente acima de cada (isto é, na superdiagonal) tem valor 0 ou 1; o elemento acima da primeira ocorrência de cada é sempre 0. Todos os outros elementos são zero. Se é diagonalizável, então todos os elementos acima da diagonal são zero.[36] Note que alguns livros-texto tem os uns na subdiagonal, isto é, imediatamente abaixo da diagonal principal ao invés de na superdiagonal. Os autovalores estão ainda na diagonal principal.[37][38]
Toda matriz n × n é similar a uma matriz na forma canônica de Jordan, obtida através da transformação similar , onde é uma matriz modal generalizada para .[39] (ver Nota acima.)
Exemplo 4
Determinar a matriz na forma canônica de Jordan que é similar a
Solução: A equação característica de é , e então é um autovalor de multiplicidade algébrica três. Seguindo o procedimento das seções precedentes temos
e
Assim, e , que implica que a base canônica para contém um autovetor generalizado linearmente independente de posto 2 e dois autovetores generalizados linearmente independentes de posto 1, ou equivalentemente, uma cadeia de dois vetores e uma cadeia de um vetor . Designando , temos
e
onde é uma matriz modal generalizada para , as colunas de são uma base canônica para , e .[40] Note que desde que autovetores generalizados não são únicos, e desde que algumas das colunas de ambos e podem ser intercambiadas, segue que ambos e não são únicos.[41]
Exemplo 5
No Exemplo 3 encontramos uma base canônica de autovetores generalizados linearmente independentes para uma matriz . Uma matriz modal generalizada para é
Uma matriz na forma canônica de Jordan, similar a é
tal que .
Aplicações
Funções matriciais
Predefinição:Main
Três das mais fundamentais operações que podem ser aplicadas sobre matrizes quadradas são adição, multiplicação por um escalar e multiplicação de matrizes.[42] Estas são exatamente as operações necessárias para definir uma função polinomial de uma matriz n × n.[43] Relembrando do cálculo básico que muitas funções podem ser expressas em uma série de Taylor, podemos definir de forma mais geral funções matriciais de forma mais simples.[44] Se é diagonalizável, isto é
com
então
e a determinação da série de Taylor para funções de é significativamente simplificada.[45] Por exemplo, para obter qualquer potência k de , basta calcular , premultiplicar por , e posmultiplicar o resultado por .[46]
Usandoautovetores generalizados podemos obter a forma canônica de Jordan para e estes resultados podem ser generalizados para um método direto para determinação de funções de matrizes não diagonalisáveis.[47]
Equações diferenciais
Predefinição:Main
Considere o problema de resolver o sistema linear de equações diferencias ordinárias
On the other hand, if is not diagonalizable, we choose to be a generalized modal matrix for , such that is the Jordan normal form of . The system has the form
where the are the eigenvalues from the main diagonal of and the are the ones and zeros from the superdiagonal of . The system (Predefinição:EquationNote) is often more easily solved than (Predefinição:EquationNote). We may solve the last equation in (Predefinição:EquationNote) for , obtaining . We then substitute this solution for into the next to last equation in (Predefinição:EquationNote) and solve for . Continuing this procedure, we work through (Predefinição:EquationNote) from the last equation to the first, solving the entire system for . The solution is then obtained using the relation (Predefinição:EquationNote).[49]