Mathematics is the art of reducing any problem to linear algebra
- William Stein.
Soit $E$ en ensemble muni d'une relation d'équivalence $\rho$. Une fonction $f: E\maps E$ donne une forme normale pour $\rho$ si, pour chaque classe d'équivalence $C$, tous les élements de $C$ sont envoyé sur le même élément $c$ de $C$. L'élément $c$ est alors appelé la forme normale des éléments de $C$.
Exemples
Quel intérêt?
Les formes normales permettent de représenter les classes d'équivalence et donc de calculer dans le quotient.
Exercice
Résoudre le système d'équations suivant sur $GF(5)$ :
$$\begin{align*} 3x_3 + x_4 + 4x_5 &= 0\\ 3x_1 + x_2 + 4x_3 + 2x_4 + x_5 &= 0\\ 4x_1 + 3x_2 + 2x_3 + x_4 + 3x_5 &= 0\\ \end{align*}$$Système fabriqué avec:
M = random_matrix(GF(5),3,5, algorithm='echelonizable', rank=2); M
M.echelon_form()
On se place dans un corps $K$ quelconque
Définition
Une matrice est sous forme échelon (en lignes) si le nombre de zéros précédant la première valeur non nulle d'une ligne augmente ligne par ligne jusqu'à ce qu'il ne reste plus que des zéros:
$$\begin{pmatrix} \underline{*} & * & * & * & * & * & * & * & * \\ 0 & 0 & \underline{*} & * & * & * & * & * & * \\ 0 & 0 & 0 & \underline{*} & * & * & * & * & * \\ 0 & 0 & 0 & 0 & 0 & 0 & \underline{*} & * & * \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & \underline{*} \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \end{pmatrix}$$Les colonnes caractéristiques sont les colonnes contenant les pivots (soulignés ci-dessus), c'est-à-dire les premiers coefficients non nul d'une ligne.
Une matrice est sous forme échelon réduite si les pivots valent 1 et si les autres coefficients dans les colonnes des pivots sont nuls:
$$\begin{pmatrix} 1 & * & 0 & 0 & * & * & 0 & * & 0 \\ 0 & 0 & 1 & 0 & * & * & 0 & * & 0 \\ 0 & 0 & 0 & 1 & * & * & 0 & * & 0 \\ 0 & 0 & 0 & 0 & 0 & 0 & 1 & * & 0 \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 1 \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \end{pmatrix}$$Exemple
M = random_matrix(QQ, 4, 8, algorithm='echelon_form', num_pivots=3); M # random
M.pivots() # random
Remarque
L'algorithme du pivot de Gauß-Jordan transforme une matrice jusqu'à ce qu'elle soit sous forme échelon (réduite).
Exercice: matrices à deux lignes
Pour chacune des matrices $M$ suivantes, écrire sous forme de multiplication à gauche par une matrice $2\times 2$ la première étape du pivot de Gauß appliqué à $M$ :
var('a1,b1,c1,a2,b2,c2')
M1 = matrix([[a1,b1,c1],[0,b2,c2]]); M
M2 = matrix([[0,b1,c1],[1,b2,c2]]); M
M3 = matrix([[a1,b1,c1],[a2,b2,c2]]); M
P = matrix([[1/a1,0],[0,1]]); P, P*M1
P = matrix([[0,1],[1,0]]); P, P*M2
P = matrix([[1,0],[-a2/a1,1]]); P, P*M3
Remarque
On appelle cela la décomposition $LU$.
Disons ici que deux matrices $M$ et $N$ de $M_{n,m}(K)$ sont équivalentes (modulo l'action de $GL_n(K)$ à gauche) s'il existe une matrice inversible $P$ telle que $M=PN$.
Exercice:
Vérifier que cela définit une relation d'équivalence!
Question
La remarque précédente dit que si deux matrices $M$ et $N$ donnent la même forme échelon réduite par Gauß, alors elles sont équivalentes.
Réciproque?
Démonstration de la réciproque
Soient $M$ et $N$ deux matrices équivalentes, et $M'$ et $N'$ leurs formes échelons réduites. On note que $M'$ et $N'$ sont équivalente: on peut prendre $P$ telle que $M'=PN'$.
Remarque: notons $M'_k$ la sous-matrice composée des $k$ premières colonnes de $M'$ et de même pour $N'$; elles sont encore sous forme échelon. Comme $P$ est inversible, elles sont de même rang, et donc ont le même nombre de lignes non nulles.
Conclusion: les colonnes caractéristiques de $M'$ et $N'$ coincident.
En regardant ce qui se passe au niveau des pivots, on déduit que les $rang(M')$ premières colonnes de $P$ sont celles de l'identité. Il s'ensuit que $M'=N'$.
Théorème
On considère les matrices $n\times m$ à coefficients dans un corps $K$. La forme échelon réduite donne une forme normale pour les matrices modulo l'action de $GL_n(K)$ à gauche.
Reprenons notre matrice:
M = matrix([[0,0,3,1,4], [3,1,4,2,1], [4,3,2,1,3]]); M
et sa forme échelon:
M.echelon_form()
Pour le moment, cette forme échelon est décrite comme le résultat d'un calcul: l'application du pivot de Gauß. C'est opératoire, mais pas très conceptuel. Par exemple, il n'est pas évident que le résultat ne dépende pas de l'ordre du calcul.
Peut-on faire mieux?
Exercice
Soient $M$ et $N$ deux matrices de $M_{n,m}(K)$, que l'on voit comme deux paquets de $n$ vecteurs de $K^m$. Montrer que $M$ et $N$ sont équivalentes (modulo l'action de $GL_n(K)$ à gauche) si et seulement si les vecteurs engendrent le même sous-espace vectoriel de $K^m$.
Corollaire
L'ensemble quotient $GL_n(K) \backslash M_{n,m}(K)$ représente l'ensemble des sous-espaces vectoriels de dimension au plus $n$ dans $K^m$. Cet ensemble est naturellement muni d'une structure de variété appelée variété Grassmanienne.
Exercice
Soit $(e_1,\dots, e_5)$ la base canonique de $K^5$, et soit $E$ le sous espace vectoriel de $K^5$ engendré par les lignes de notre matrice favorite $M$.
Pour $i$ de $1$ à $5$, calculer la dimension de l'espace vectoriel
$$E_i = E \cap \langle e_i,\dots,e_5\rangle`$$Lien avec les groupes de permutations
Pour manipuler un sous-groupe $G$ du groupe symétrique $S_n$, on avait considéré le sous-groupe $G_{n-1}$ des éléments fixant $n$, puis ceux fixant $n$ et $n-1$, et ainsi de suite récursivement.
Formellement, on avait considéré la suite des groupes symétriques emboîtés:
$$\{id\} = S_0\subsetneq S_1 \subsetneq \cdots \subsetneq S_n$$et la suite induite des groupes emboîtés $G_i:=G \cap S_i$ :
$$\{id\} = G_0\subset G_1 \subset \cdots \subset G_n=G$$L'étude de $G$ se ramenait alors à l'étude des quotients successifs $G_i/G_{i-1}$.
Appliquons le même programme.
Définition: Drapeau
Un drapeau complet d'un espace vectoriel $V$ de dimension $n$ est une suite maximale de sous-espaces strictement emboîtés:
$$\{0\} = V_0 \subsetneq V_1 \subsetneq \cdots \subsetneq V_n=V$$Définition: Drapeau canonique
À chaque base ordonnée, on peut associer naturellement un drapeau complet. Ici on considérera principalement le drapeau canonique associé à la base canonique $e_1,\cdots,e_m$ de $V=K^m$ :
$$V_i:=\langle e_{m-i+1} \cdots e_m \rangle$$Note: on prend les éléments dans cet ordre pour que cela colle avec nos petites habitudes de calcul du pivot de Gauß. Et pour alléger les notations, on utilisera plutôt:
$$\overline V_i:=\langle e_i \cdots e_m \rangle=V_{n-i+1}$$Formes échelon et bases adaptées
Dans ce formalisme, qu'est-ce qu'une matrice sous forme échelon?
C'est une base d'un espace vectoriel $E$ adaptée à un drapeau complet donné. C'est-à-dire une base sur laquelle on peut lire immédiatement les sous espaces $E_i:=E\cap \overline V_i$.
Le pivot de Gauß est un algorithme de calcul de base adaptée.
Définition intrinsèque des colonnes caractéristiques
Remarque: en passant de $E_{i+1}$ à $E_i$, la dimension croît de $0$ ou de $1$.
Cela permet de donner une définition intrinsèque de la notion de colonnes caractéristiques d'un sous espace vectoriel $E$ : les $i$ tels que la dimension de $E_i$ croît strictement. Cela décrit la position de $E$ par rapport à un drapeau complet fixé.
Évidemment, sur une forme échelon pour $E$, cela correspond aux colonnes $i$ pour lesquelles on a un vecteur de la forme $e_i+\cdots$.
Formes échelon réduites
Considérons deux bases adaptées d'un même espace vectoriel $E$. Pour $i$ une colonne caractéristique, on note $a_i$ et $b_i$ les vecteurs de la forme $a_i=e_i+\cdots$ et $b_i=e_i+\cdots$.
Alors $a_i-b_i\in V_{i+1}$; autrement dit $a_i=b_i$ dans le quotient $E_i/E_{i+1}$.
Prendre une forme échelon réduite, c'est faire un choix d'un représentant (relativement canonique) $a_i$ dans chaque quotient $E_i/E_{i+1}$ : celui qui a des zéros aux autres colonnes caractéristiques.
Ce formalisme montre que le vecteur $a_i$ est intrinsèque à $E$ (et au choix du drapeau complet). En particulier il est clair qu'il est complètement indépendant des autres coefficients de la forme échelon réduite, même si opératoirement le calcul de $a_i$ par Gauß passe par ceux-ci.
Remarque
La permutation $P$ apparaissant dans le calcul de l'algorithme de Gauß a une interprétation géométrique naturelle (position du drapeau $\langle v_1\rangle, \langle v_1,v_2\rangle$ par rapport au drapeau canonique).
Les variétés Grassmaniennes et ses variantes (variétés de drapeaux, ...) et leur multiples généralisations sont l'objet d'études approfondies en géométrie. La combinatoire y joue un rôle important: l'apparition d'une permutation $P$ dans le pivot de Gauß est le prototype du type de lien.
Exercice: résolution d'équations linéaires
Soit $E$ un ensemble d'équations linéaires/affines. Retrouver les algorithmes usuels de résolution: existence de solution, dimension, base et paramétrisation de l'espace des solutions.
Exercice: calcul avec les sous espaces vectoriels
On considère des sous espaces $E$, $F$, ... de $V=K^n$ donnés par des générateurs ou des équations. Donner des algorithmes (et leur complexité!) pour:
Exercice: calcul avec les morphismes
Soit $\phi$ une application linéaire entre deux espaces vectoriels $E$ et $F$ de dimension finie. Donner des algorithmes pour:
On considère maintenant l'anneau $\ZZ$. On est maintenant en train de travailler avec des $\ZZ$-modules au lieu d'espaces vectoriels.
Peut-on procéder comme précédemment?
Exercice: matrices à deux lignes
Exemple:
M = matrix([[10,1,2], [6,2,-1]]); M
M.echelon_form()
Remarque clef
Soit $\begin{pmatrix}a\\b\end{pmatrix}$ un vecteur de $\ZZ^2$, et $r, u,v$ les résultats du pgcd étendu de $a$ et $b$ : $r = a\wedge b = ua+bv$. Posons:
$$M := \begin{pmatrix} u & v \\ \frac -br & \frac ar \\ \end{pmatrix}$$alors: $M\begin{pmatrix}a\\b\end{pmatrix} = \begin{pmatrix}r\\0\end{pmatrix}$ et $M\in GL(\ZZ)$ ($\det(M)=1$)!
Moralité: la majeure partie de ce que l'on a vu précédemment s'applique mutatis-mutandis. L'algèbre linéaire sur $\ZZ$ n'est pas foncièrement plus compliquée ou coûteuse que sur un corps.
Il y a juste quelques points techniques à traiter, qui apparaissent en fait déjà en dimension $1$.
Théorème
Tout sous module d'un $\ZZ$-module libre de dimension finie $n$ est libre de dimension finie $\leq n$.
Exercice
Exemple
V = ZZ^6
I = V.zero_submodule(); I
I = I + V.submodule([V.random_element(prob=.3)]); I # random
Exercice: Résolution
Déterminer l'ensemble des solutions entières de l'équation $6x+4y+10z=18$.
Exercice: Torsion
Donner un exemple de quotient d'un module libre $\ZZ^n$ qui n'est pas isomorphe à un module libre.
Exercice
Soit $G$ un groupe additif abélien engendré par un nombre fini $n$ d'éléments
Tout ce que l'on vient de dire se généralise immédiatement pour un anneau principal quelconque comme $A=\QQ[x]$; à condition bien entendu que $A$ soit constructif, et en particulier, qu'il y ait un algorithme pour calculer le PGCD étendu.
Soit $A$ un anneau. Par exemple un anneau de polynômes multivariés $A=\QQ[x,y]$. Qu'est-ce qui subsiste de tout ce que l'on a vu?
Un $A$-sous-module de $A^1$ est juste un idéal de $A$.
Exemple: $\langle x^2y, xy^2\rangle$
Calcul avec les idéaux et sous-modules: bases de Gröbner
Combinatoire sous-jacente: idéaux monomiaux!
Explorons un exemple:
pretty_print_default()
A = QQ['a']
a = A.gen()
M = matrix(A, random_matrix(ZZ, 3, 8)); M[0,0] = a; M
N = copy(M)
M[1] = M[0,0] * M[1] - M[1,0] * M[0]
M[2] = M[0,0] * M[2] - M[2,0] * M[0]
M
M[2] = M[1,1] * M[2] - M[2,1] * M[1]
M
Revenons sur notre exemple:
M
On constate que $a$ divise la troisième ligne; on peut donc diviser de manière exacte par $a$ :
M[2] = M[2] / a
M
De plus, le coefficient M[3,3]
est le déterminant de la matrice d'origine:
N[:,:3]
N[:,:3].det()
Ce phénomène est général et peut être utilisé récursivement:
Algorithme de Gauß-Bareiss
On procède comme pour Gauß sans fractions, y compris pour traiter les lignes avec un coefficient nul dans la colonne du pivot. Cependant, avant de traiter les colonnes $\geq i+2$ on divise tout le quadrant inférieur composé des lignes et colonnes $\geq i+2$, par $M[i,i]$.
Le fonctionnement de l'algorithme repose sur la propriété suivante:
Proposition
Soit $M$ une matrice sur un anneau intègre. Après avoir traité les $i$ premières colonnes, $M_{i,i}$ est le déterminant du $i$-ème mineur dominant de la matrice d'origine (correspondant aux $i$ premières lignes et colonnes). De plus après avoir traité la colonne $i+1$, ce déterminant divise toutes les coefficients $M_{i',j'}$ avec $i',j'\geq i+2$.
Exercice
Vérifier la proposition dans le cas d'une matrice triangulaire supérieure.
Remarque
Pour simplifier, on a supposé ci-dessus que la matrice était carrée et que tous les mineurs dominants étaient non nuls. Modulo les détails techniques usuels (forme échelon réduite plutôt que uni triangulaire supérieure), l'algorithme se généralise à des matrices quelconques sur un anneau intègre.
Le coeur de l'algèbre linéaire est l'étude des matrices modulo des relations d'équivalences (équivalence, conjugaison, similitude), et ce sur les différents types d'anneaux.
Dans chaque cas, on introduit une notion d'ordre (plus conceptuellement de drapeau) qui permet de définir simultanément une forme normale et un algorithme d'élimination permettant de calculer cette forme normale.
Voir par exemple [Storjohan.2004]_ pour une présentation d'ensemble.
Exercice: Du calcul matriciel au calcul sur les sous espaces vectoriels
V = random_matrix(QQ, 4, 10, algorithm='echelonizable', rank=3).rows() # random
V
On veut calculer une base du sous-espace vectoriel engendré par $V$. On peut l'obtenir simplement avec les outils déjà présents:
```{.python .input} E = QQ^10 E.span(V)
```{.json .output}
[{"execution_count": 1, "output_type": "execute_result", "data": {"text/plain": "Vector space of degree 10 and dimension 3 over Rational Field\nBasis matrix:\n[ 1 4 -5 0 0 2 1 -3 1 -2]\n[ 0 0 0 1 0 0 0 1 -2 -1]\n[ 0 0 0 0 1 0 3 1 0 2]"}, "metadata": {}}]
Implanter votre propre fonction `baseSEV(V)` qui calcule une telle base en se ramenant à du calcul matriciel.
Vous pouvez au choix réutiliser la méthode `echelon_form` des matrices ou la réimplanter.
u = E([1, 2, 5, 3, 0, 1, 6, 3, 0, 5])
u in V
Comme ci-dessus, implanter votre propre fonction `appartient(V,v)` qui se ramène à du calcul matriciel.
SEV_egaux(U, V)
qui teste si deux listes deux vecteurs engendrent le même sous espace vectoriel.SEV_orthogonal(V)
pour calculer une base de l'orthogonal de $\langle V\rangle$, c'est-à-dire l'ensemble des vecteurs $u$ du dual de $E$ tel que $\langle u,v\rangle=0$.Quel rapport avec la résolution d'équations?
SEV_somme(U, V)
qui calcule une base de la somme des deux sous-espaces vectoriels $\langle U\rangle$ et $\langle V\rangle$.SEV_intersection(U,V)
et SEV_en_somme_directe(U,V)
.Exercice: algorithme de Gauß-Bareiss
Dans tout cet exercice, on pourra supposer que la matrice d'entrée est inversible, voire que ses $n$ premiers mineurs sont non nuls (pas de permutation des lignes nécessaire).
M = matrix([[2, 1, 3], [1, 4, 9], [1, 8, 27]]); M
Évaluer la complexité pratique en prenant des matrices aléatoire de taille $n=1,2,...$. Comparer avec ce que l'on obtient avec Gauß, et avec Gauß sur un corps fini.
Qu'en pensez-vous?
Algèbre linéaire, représentations des monoïdes et Chaînes de Markov
Voir: agregation.bibliotheque_tsetlin.
Ce texte est à approcher comme les textes de l'agrégation: il s'agit d'un menu à la carte; vous pouvez choisir d'étudier certains points, pas tous, pas nécessairement dans l'ordre, et de façon plus ou moins fouillée. Vous pouvez aussi vous poser d'autres questions que celles indiquées plus bas. L'objectif final est de concevoir un mini-développement de 5 minutes comportant une partie traitée sur ordinateur et, si possible, des représentations graphiques de vos résultats.