Sulla regola dei segni di Cartesio

Luca Granieri

granieriluca@libero.it  digilander.libero.it/granieri/

 

Nello studio dell’algebra, quando ci si imbatte nelle equazioni di secondo grado, si sente talvolta parlare della regola di Cartesio sui segni delle radici.
Per il polinomio \(ax^2+bx+c=0\) è possibile determinare il segno delle sue eventuali radici dall’esame della sua \(\textit{segnatura}\), ovvero da come si susseguono i segni dei suoi coefficienti disposti in ordine decrescente rispetto al grado.

Ad esempio per \(2x^2-3x+1\) la segnatura è \( +-+\), mentre per \(-x^2-3x+1\) la segnatura è \( –+\).

Si impara allora che il numero delle radici positive (reali) del polinomio dipende dalle cosiddette \(\textit{variazioni}\), ovvero dal numero di volte che la segnatura del polinomio si modifica. Negli esempi fatti, la prima segnatura ha due variazioni, mentre la seconda segnatura ha una sola variazione.

Il numero delle radici (reali) negative dipende invece dalle cosiddette \(\textit{permanenze}\), ovvero dal numero di volte in cui la segnatura resta costante. Così la segnatura di \(2x^2-3x+1\) ha zero permanenze, mentre \(-x^2-3x+1\) ha una permanenza.

Il polinomio \(x^2+2x+1\) ha segnatura \( +++\) e quindi ha due permanenze e zero variazioni.

Nel caso dei polinomi di secondo grado è facile precisare il numero delle radici positive (e negative). Intanto, dividendo se necessario per il coefficiente di grado massimo, possiamo sempre supporre che la segnatura inizi con un \(+\).

Ricordiamo che per il polinomio di secondo grado il prodotto delle radici, se esistono, è dato da \(x_1\cdot x_2= \frac{c}{a}\).

Poiché stiamo assumendo, senza perdere di generalità, che \(a=1\), allora il segno del prodotto delle radici è semplicemente dato dall’ultimo segno della segnatura. D’altra parte, la somma delle radici vale \(x_1+x_2=-\frac{b}{a}\).

Dunque, il segno della somma delle radici è dato dall’opposto del secondo segno della segnatura.

Ora, per zero variazioni abbiamo la segnatura \(+++\) e il prodotto delle radici è positivo mentre la somma è negativa. Pertanto non possono esserci radici positive.

Se invece abbiamo una variazione, la corrispondente segnatura è \(+–\), oppure \(++-\). Allora il prodotto delle radici è negativo. Dunque, se c’è una radice positiva, l’altra dev’essere negativa. Il numero massimo di radici positive è allora pari ad uno.

Se infine ci sono due variazioni la segnatura è \(+-+\). Il prodotto delle radici è positivo come pure la somma. Se il polinomio ha radici non può che avere radici positive.

Morale della favola: Il numero di radici positive è minore o oguale al numero di variazioni.

Per i polinomi di primo grado la situazione è ancora più facile. Dato il polinomio \(ax+b\), con \(a\neq 0\) (altrimenti non sarebbe di primo grado) la sua radice è \(x=-\frac{b}{a}\). Pertanto, se c’è una variazione nella segnatura si ha una radice positiva. Se invece si ha una \(\textit{permanenza}\) del segno nella segnatura corrispondente si ottiene una radice negativa.

 

Dunque, c’è un legame specifico tra la segnatura del polinomio e il segno delle sue radici. Per i polinomi di primo e secondo grado questo legame è emerso dalla conoscenza esplicita delle sue radici in funzione dei coefficienti del polinomio stesso.

Esistono delle formule del genere, ma molto più complicate, anche per i polinomi di terzo e quarto grado (si veda ad esempio [5]).

Ma uno studio esplicito della segnatura e del segno delle radici sarebbe alquanto difficoltoso e tedioso. Per di più, come è stato dimostrato da Abel e Galois, tali tipi di formule (che utilizzino soltanto le usuali operazioni algebriche e l’estrazione di radicali) non esistono per polinomi di grado superiore a quattro.
Ma il fatto interessante è che la cosiddetta regola di Cartesio sui segni resta valida per polinomi di grado qualsiasi.

In effetti, è facile stimare il numero di radici nulle di un polinomio \(P(x)\). Basterà guardare (in ordine crescente) il primo coefficiente \(p_h\neq 0\). In tal caso il polinomio ha esattamente \(h\) radici nulle (o se vogliamo una radice nulla di molteplicità \(h\)) giacché è possibile raccogliere il fattore \(x^h\). Dunque, per quantificare le radici positive o negative potremo supporre di avere a che fare con polinomi aventi termine noto \(p_0\neq0\).

Indicando con \(\mathcal V(P(x))\) il numero di variazioni nella segnatura del polinomio \(P(x)\) e con \(\mathcal R^+(P(x))\) il numero di radici positive di \(P(x)\) possiamo esprimere la legge di Cartesio mediante la seguente
\[\mathcal R^+(P(x))\leq \mathcal V(P(x)) .\]

Una dimostrazione semplice è per induzione. A tal fine, occorre capire come si modifica la segnatura (ricordando il teorema di Ruffini) moltiplicando un polinomio per un fattore del tipo \(x-a\) con \(a>0\). Se \(P(x)=p_nx^n +p_1x+\cdots + p_0\), dividendo per \(p_n\) possiamo sempre supporre che il coefficiente del termine di grado massimo sia pari ad uno. Inoltre, potremo sempre supporre che il termine noto sia diverso da zero, altrimenti possiamo fattorizzare il polinomio riducendoci poi ad uno di grado inferiore che abbia termine noto non nullo. Questa operazione equivale naturalmente a trascurare le eventuali radici nulle del polinomio. Ciò detto, esprimiamo il nostro prodotto nella forma
\[P(x)(x-a)= x^{n+1} +\sum_ {k=1}^n\left ( p_{k-1}-p_ka \right )x^k -p_0a . \quad (1)\]

Se la segnatura di \(P(x)\) presenta una variazione allora \(p_{k-1}\cdot p_k<0\) per qualche\(k=1,\cdots , n\).

Allora, il termine \(p_{k-1}-p_ka\) ha lo stesso segno di \(p_{k-1}\). Questa semplice osservazione ci permette di confrontare la segnatura di \(P(x)\) con quella del prodotto (1). Esaminando le segnature da sinistra verso destra, partendo cioè dal termine di grado massimo, entrambe le segnature presentano un segno \(+\). A questo punto, se in \(P(x)\) c’è una variazione, compare un segno \(-\) in corrispondenza di un certo \(p_{k-1}\) nella segnatura di \(P(x)\). Ma allora, compare automaticamente un segno meno anche nella segnatura del prodotto (1) in corrispondenza del termine \( p_{k-1}-p_ka\). La situazione è dunque simile alla seguente
\[ \begin{array}{ccc} P(x) & +\ +\ + \ – & \cdots \\
P(x)(x-a) & + \ ? \ ? \ – & \cdots \end{array} \]

dove il punto interrogativo indica elementi della segnatura che non possiamo stabilire a priori. Ma qualunque sia il segno corrispondente, la segnatura del prodotto (1) contiene almeno tante variazioni quante sono quelle di \(P(x)\).
Ma il prodotto (1) contiene il coefficiente aggiuntivo \(-p_0a\) che è di segno opposto rispetto a \(p_0\). Dunque, esaminando questa volta le segnature da destra verso sinistra, queste cominciano con un segno discorde e non appena compare una variazione nella segnatura di \(P(x)\) ne appare automaticamente un’altra in quella del prodotto (1).
La situazione è dunque simile alla seguente
\[\begin{array}{ccc} P(x) & \cdots & + \ + \ – \ + \\
P(x)(x-a) & \cdots & ? \ ? \ -\ + \ – \end{array}\]
In altre parole, la segnatura del prodotto (1) contiene almeno una variazione in più rispetto a \(P(x)\).

Abbiamo pertanto dimostrato che
\[\mathcal V(P(x))+1\leq \mathcal V\left ( P(x)(x-a) \right ) .\]

Nel caso di una radice multipla, un immediato adattamento degli argomenti precedenti mostra che
\[ \mathcal V(P(x))+\alpha \leq \mathcal V\left ( P(x)(x-a)^\alpha \right ) .\]
Siamo pronti per dimostrare il seguente

Lemma  [del segno di Cartesio]

Dato un polinomio \(P(x)\) di qualunque grado \(n\) si ha che
\[ \mathcal R^+(P(x))\leq \mathcal V(P(x)). \]

Dim.

Procediamo per induzione sul numero \(m\) di radici positive del polinomio.

Per \(m=0\) ovviamente \( 0= R^+(P(x))\leq \mathcal V(P(x))\).

Supponiamo allora che la disuguaglianza in oggetto sia vera per polinomi con \(m\) radici positive e dimostriamola per \(m+1\).

Sia dunque \(P(x)\) un polinomio con \(m+1\) radici positive. Sia \(a>0\) una di queste.

Applicando il Teorema di Ruffini possiamo scrivere
\[ P(x)= Q(x) (x-a) \]

dove \(Q(x)\) ha \(m\) radici positive. Per ipotesi induttiva possiamo allora valutare che
\[ \mathcal R^+(P(x))=m+1= \mathcal R^+ (Q(x))+1\leq \mathcal V(Q(x))+1\leq \mathcal V \left (Q(x)(x-a)\right )=\mathcal V(P(x)).\]

 

Un discorso analogo si potrebbe fare per le radici negative. A tal fine, se \(b\) è una radice negativa
di \(P(x)\), fattorizzando abbiamo \(P(x)=(x-b)Q(x)\).

Valutando allora \(P(-x)=(-x-b)Q(-x)\) si trova che \(-b\) è una radice positiva di \(P(-x)\). In parole povere, le radici negative di \(P(x)\) non sono altro che le radici positive di \(P(-x)\).
Il Lemma di Cartesio ci consente allora di stimare il numero di radici negative \(\mathcal R^-(P(x))\) di \(P(x)\):
\[ \mathcal R^-(P(x))=\mathcal R^+(P(-x))\leq \mathcal V(P(-x)).\]

A questo punto, occorre legare le variazioni di \(P(-x)\) con quanto accade per il polinomio originario \(P(x)\).

Osserviamo che il cambio di variabile \(x\mapsto -x\) modifica la segnatura di \(P(x)\) per i coefficienti dei termini di grado dispari, lasciando invece inalterato il segno di quelli corrispondenti al grado pari.

Se dunque c’è una variazione, ad esempio del tipo \(+\ -\) in \(P(-x)\), allora uno dei due segni è opposto e l’altro identico nella segnatura di \(P(x)\) che quindi può essere soltanto del tipo \(+ \ +\) oppure \(- \ -\). Il segno nella segnatura di \(P(x)\) non varia. Diremo che si tratta di una \(\textit{permanenza}\).

Indicando con \(\mathcal P(P(x))\) il numero di permanenze nella segnatura di \(P(x)\), ci si aspetterebbe che \(\mathcal V(P(-x))=\mathcal P(P(x))\). Ma questo è senz’altro valido nel caso in cui il polinomio abbia tutti i coefficienti non nulli, in modo tale da essere sicuri che si alternino termini di grado pari e di grado dispari.

Il fatto è che se qualche coefficiente è nullo, non possiamo limitarci a trascurarlo come abbiamo tacitamente fatto per il conteggio delle variazioni.

Tutti i ragionamenti fatti per le variazioni continuano invece a valere se qualcuno dei coefficienti del polinomio è nullo. Al fine di valutare le radici positive, i coefficienti nulli si possono semplicemente trascurare.

Ma se rivolgiamo l’attenzione alla radici negative, ci si può imbattere in qualche sorpresa.

Infatti, considerando ad esempio il polinomio \(x^3-7x-6\), trascurando i coefficienti nulli valuteremmo solo una permanenza.

Ma \(P(-x)= -x^3+7x-6\) avrebbe ben due variazioni cosicché sarebbe \(\mathcal V(P(-x))\neq\mathcal P(P(x))\). E anche la stima sulle radici negative andrebbe a farsi benedire. Fattorizzando si trova infatti che \(P(x)= x^3-7x+6 = (x+1)(x+2)(x-3)\) e quindi ci sarebbero ben due radici negative a fronte di una sola permanenza.

Un esempio ancora più disarmante è \(P(x)=x^2-1\) che non avendo permanenze non dovrebbe avere nessuna radice negativa. Mentre l’unica variazione è in linea con la presenza di una radice positiva.

Per far quadrare i conti occorre allora ripensare il nostro modo di contare le permanenze.

Se abbiamo un coefficiente nullo, questo può essere pensato come \(+ \cdot 0\) oppure equivalentemente come un \(- \cdot 0\).

Quale segno scegliere? La cosa migliore sarebbe scegliere un criterio che consenta di dedurre l’uguaglianza \(\mathcal V(P(-x))=\mathcal P(P(x))\).

Dunque, consideriamo un gruppo consecutivo di coefficienti di \(P(-x)\) con qualche elemento nullo:
\[p_i, 0, \cdots, 0, p_j. \]

Se \(p_i\) e \(p_j\) sono discordi, essi contribuiscono ad una variazione. Vorremmo allora che la nostra scelta per i segni da attribuire agli elementi nulli produca esattamente una permanenza per la segnatura di \(P(x)\).

Se \(i,j\) sono uno dispari ed uno pari allora tra \(p_i\) e \(p_j\) c’è un numero pari di zeri. Allora (ricordiamo che i corrispondenti segni nella segnatura di \(P(x)\) coincidono per i termini di indice pari e sono di segno opposto per quelli di indice dispari) possiamo scegliere i segni per i coefficienti nulli in modo opposto al termine di indice appena superiore, così da recuperare un’unica permanenza per \(P(x)\).

Se invece \(i,j\) sono entrambi pari o entramabi dispari, allora tra \(p_i\) e \(p_j\) cadono un numero dispari di zeri. Colmando i segni dei coefficienti nulli con la scelta di prima, recuperiamo ancora un’unica permanenza per \(P(x)\).

Ricapitolando, ad esempio per il polinomio \(x^5-x^3+1\), per il conteggio delle permanenze dovremo considerare la segnatura
\[ + \ – \ – \ + \ – \ + \]

riempiendo con il dovuto segno (l’opposto di quello immediatamente a sinistra) gli spazi relativi ai coefficienti nulli.

Può sembrare strano che si debbano scegliere due modi diversi per conteggiare le variazioni e le permanenze di un polinomio.

Il fatto è che tale scelta assicura la validità dell’uguaglianza
\[\mathcal V(P(-x))=\mathcal P(P(x)).\]

Meno strano è che le scelte effettuate per il conteggio delle permanenze e delle variazioni è quella che rende minimo possibile il numero delle permanenze e delle variazioni stesse. Ogni altra possibile scelta cioè condurrebbe ad un numero più grande di variazioni e/o di permanenze, e quindi a sovrastimare in qualche modo il numero di radici positive o negative del polinomio.

Riassiumiamo quanto trovato fino ad ora aggiungendo qualche interessante osservazione

Teorema [di Cartesio sui segni]

Dato un polinomio \(P(x)\) di grado \(n\) qualunque, si ha
\[\mathcal R^+(P(x))\leq \mathcal V(P(x)); \quad \mathcal R^-(P(x))\leq \mathcal P(P(x)). \]

Inoltre, se \(P(x)\) ha esattamente \(n\) radici (considerate con la loro molteplicità), allora \[\mathcal R^+(P(x))= \mathcal V(P(x)); \qquad \mathcal R^-(P(x))= \mathcal P(P(x)) .\]

Dim.

Dobbiamo provare soltanto la parte riguardante le radici negative. Ma questo è ormai un calcolo immediato (con la convenzione fatta per il conteggio delle permanenze)
\[\mathcal R^-(P(x))=\mathcal R^+(P(-x))\leq \mathcal V(P(-x))= \mathcal P(P(x)).\]

Supponiamo ora che il polinomio abbia esattamente \(n\) radici. Alcune di queste potrebbero essere nulle.

Come osservato in precedenza, la presenza di radici nulle non altera il conteggio delle permanenze e delle variazioni.

Ovviamente, trattandosi di un conteggio sui coefficienti del polinomio, indicando con \(\mathcal R^0(P(x))\) il numero di radici nulle, abbiamo che

\[\mathcal P(P(x))+\mathcal V(P(x))+\mathcal R^0(P(x))\leq n .\]

Se per assurdo fosse \(\mathcal R^+(P(x))< \mathcal V(P(x))\) o \(\mathcal R^-(P(x))< \mathcal P(P(x))\) avremmo la contraddizione
\[ n= \mathcal R^0(P(x))+\mathcal R^+(P(x))+\mathcal R^-(P(x))<\mathcal R^0(P(x))+ \mathcal V(P(x))+ \mathcal P(P(x))\leq n .\]

Il numero di radici positive o negative che siano può anche essere quantificato, in modo indipendente dalla regola di Cartesio, mediante la cosiddetta regola di Fourier

Teorema [Regola di Fourier]

Per un qualunque polinomio \(P(x)\) il numero di radici positive (risp. negative) e il numero di variazioni (risp. permanenze) hanno la stessa \(\textit{parità}\). In termini di algebra modulare questo significa che
\[ \mathcal R^+(P(x))\equiv \mathcal V(P(x)) \ mod \ 2 ;\qquad \mathcal R^-(P(x))\equiv \mathcal P(P(x)) \ mod \ 2 .\]

Dim.

Sia \(P(x)=x^n+p_{n-1}x^{n-1}+\cdots + p_1 x+p_0\) con \(p_0\neq 0\).

Sia \(k=\mathcal R^+(P(x))\) e \(h= \mathcal R^-(P(x))\).

Indichiamo rispettivamente con \(\alpha_i >0, \beta_ j<0\) le radici positive e negative di \(P(x)\).

Fattorizzando possiamo allora scrivere
\[P(x)= (x-\alpha_1)\cdots (x-\alpha _k)(x-\beta_1)\cdots (x-\beta_h) Q(x)\]

dove \(Q(x)\neq 0\). Valutiamo che
\[p_0= P(0)= (-1)^k\alpha_1\cdot \alpha_2 \cdots \alpha_k \cdot(-\beta_1)\cdot (-\beta_2)\cdots (-\beta_h) Q(0) .\]

A patto di un cambio di segno nei coefficienti di \(P(x)\), possiamo assumere in particolare che sia \(Q(0)>0\).

Abbiamo dunque che \(p_0=(-1)^k\cdot a\) per un numero positivo \(a>0\).

Se dunque \(k\) è pari, allora la segnatura di \(P(x)\) inizia e finisce con un segno \(+\).
Siamo dunque in una situazione del tipo \( + \ – \ + \cdots \ +\).
La comparsa di un segno meno produce automaticamente due variazioni, mentre ogni altro segno \(+\)
non fa altro che confermarne il numero di variazioni già acquisito.

Il numero delle variazioni è allora anch’esso pari.

Se invece \(k\) è dispari, allora la segnatura è del tipo \( + \ – \ + \cdots \ -\).

Il primo segno \(-\) (procedendo da sinistra verso destra) produce una variazione.

Ogni altro segno \(+\) produce automaticamente due variazioni mentre i successivi segni \(-\) non fanno che confermare il numero di variazioni già acquisito.

In altre parole, anche il numero di variazioni è dispari.

Per quello che riguarda le radici negative basta osservare che \(\mathcal R^-(P(x))=\mathcal R^+(P(-x))\). In questo modo, il numero di radici negative ha la stessa parità di \(\mathcal V(P(-x))= \mathcal P(P(x))\).

Stante la regola di Fourier (e quella di Cartesio), il numero massimo di radici positive (risp. negative) di \(P(x)\) è sempre uguale al numero di variazioni (risp. permanenze) diminuite di un numero pari.

Se ad esempio un polinomio presenta quattro variazioni (risp. permanenze), allora questo può avere nessuna, due o quattro radici positive (risp. negative).

Se invece il numero di variazioni (risp. permanenze) è diciamo tre, allora il polinomio può avere una o tre radici positive (risp. negative).

In particolare, se il numero delle variazioni (risp. permanenze) è dispari allora il polinomio ammette almeno una radice positiva (risp. negative).

Bibliografia

[1] A. Albano, La regola dei segni di Cartesio, 2004.
[2] A. A. Albert. An inductive proof of Descartes’s rule of sign. The American Mathematical Monthly, 50(3):178, Mar. 1943.
[3] Michael Bensimhoun, HISTORICAL ACCOUNT AND ULTRA-SIMPLE PROOFS OF DESCARTES’, RULE OF SIGNS, DE GUA, FOURIER AND BUDAN’S RULES, https://arxiv.org/abs/1309.6664
[4] N. B. Conkwright. An elementary proof of the Budan-Fourier theorem. The American Mathematical Monthly, 50(10):603, 1943.
[5] L. Granieri, Elementi di Matematica, Matematica elementare pre-universitaria, Edizioni LaDotta, 2013.
[6] P. V. Krishnaiah. A simple proof of Descartes’s rule of signs. Mathematics Magazine, 36(3):135, 1963.

[7] X. Wang. A simple proof of Descartes’s rule of signs. The American Mathematical Monthly, 111(6): 525, 2004.

 

Scarica qui questo articolo in pdf.

Autore dell'articolo: Luca Granieri

Lascia un commento