3
CAPITOLO 1
1.1 Teoria Spin Coupled
L’estensione delle idee di Heitler e London1, ed in particolare dell’approccio di
Coulson e Fischer2, ai sistemi a N-elettroni porta la funzione d’onda ad assumere la
seguente forma:
[ ]ΨSM Sk
k
f
N S M k
NN c
S
N
= ⋅⋅⋅
=
∑( !) / ;1 2
1
1 2A ff f Q (1)
Questa equazione rappresenta la funzione d’onda spin coupled monoconfigurazionale
per un sistema ad N-elettroni con spin totale S (e proiezione M). Le fi=fi(ri) sono un
insieme di N orbitali non-ortogonali singolarmente occupati. Le
( )QS M kN SNk f; , , ...,=1 2 (2)
sono le funzioni di spin N-elettroniche, autofunzioni degli operatori $S 2 e $S
z
, in cui
l’indice k indica i differenti accoppiamenti possibili tra i singoli spin. La scelta tra le
numerose procedure per la costruzione delle autofunzioni di spin3 è dettata dalla
natura del problema in esame e dalla ‘convenienza computazionale’. In genere si
preferisce esprimere le QS M kN ; nella base di Rumer, queste funzioni a differenza di
quelle genealogiche (base di Kotani) sono non-ortogonali ma caratterizzate da una
maggiore interpretabilità chimica, evidenziando la presenza di doppietti di legame. I
coefficienti csk nella (1), detti coefficienti spin-coupling, indicano l’importanza relativa dei
diversi accoppiamenti (strutture) di spin.
Le singole autofunzioni di spin possono essere scritte come combinazioni lineari
delle primitive di spin
QS M kN Ik I d
I
N
b N
N
N
d
;
= =
∑ Ω
a
(3)
dove le Ω I sono costituite dal prodotto di N funzioni di spin monoelettroniche (Na
funzioni α(σ) e N-Na funzioni β(σ)). I bIk sono i coefficienti della combinazione
lineare che, nella base di Rumer, assumono esclusivamente i valori 0 o ±1. Inserendo
questo sviluppo nella (1) è possibile esprimere la funzione d’onda spin-coupled
come combinazione di Nd determinanti di Slater UI, ognuno formato da N spin-
orbitali non-ortogonali
4
ΨSM Sk
k
f
Ik I
I
N
c b U
S
N
d
=
=
∑ ∑
1
(4)
Il valore di aspettazione dell’energia per questa funzione d’onda sarà dato da
E
H
c c b b U H USM SM
SM SM
Sk Sl
k l
f
Ik Jl I J
I J
NS
N
d
= = ∑ ∑Ψ ΨΨ Ψ ∆
$
$
, ,
1
(5)
dove ∆ rappresenta l’integrale di normalizzazione (∆ Ψ Ψ= SM SM ). Utilizzando la
formula di Lowdin4 per spin orbitali non-ortogonali si ricavano gli elementi di
matrice dell’Hamiltoniano tra determinanti di Slater
( ) ( ) ( ) ( ) ( )U H U h S g S
I J
N
IJ IJ IJ IJ IJ
N
$
, , , ,
= +∑ ∑f f mn mn f f f f mn st mn stm n
m n
m n s t
m n s t
δ δ δ
1
2
(6)
dove le SIJ sono le matrici di sovrapposizione tra gli spin-orbitali dei due
determinanti di Slater UI e UJ, e SIJ(µ|ν) e SIJ(µν|στ) i corrispondenti cofattori del
primo e del secondo ordine. I coefficienti δ IJ(µν), che derivano dall’esplicitazione
degli integrali di spin, sono uguali a uno quando il µ-esimo spin-orbitale del
determinante UI è in concordanza di spin con il ν-esimo di UJ, e zero altrimenti.
Inserendo questo sviluppo nella (5) e scambiando l’ordine delle sommatorie
( ) ( )E h g
N N
= +
∑ ∑1 1
2∆
f f mn f f f f mn stm n
m n
m n s t
m n s t
D D
, , , ,
(7)
I termini
( ) ( ) ( )D mn d mn mn= ∑∑ c c b b SSk Sl Ik Jl IJ IJ
I J
N
k l
f dS
N
,,
( ) ( ) ( ) ( )D mn st d mn d st mn st= ∑∑ c c b b SSk Sl Ik Jl IJ IJ IJ
I J
N
k l
f dS
N
,,
sono una opportuna combinazione dei cofattori, chiamati supercofattori, e
corrispondono alle matrici densità del primo e secondo ordine rispettivamente5.
La funzione d’onda spin coupled viene quindi determinata ottimizzando
variazionalmente i coefficienti spin-coupling e gli orbitali allo stesso tempo.
L’approccio spin-coupled al problema permette di recuperare, rispetto al calcolo
HF, la quasi totalità della correlazione elettronica statica6, quella parte della
5
correlazione fondamentale per la corretta descrizione dei processi dissociativi. La
principale limitazione di questa tecnica è la necessità di determinare le matrici densità
(fino a quelle del quart’ordine se l’algoritmo di minimizzazione comporta il calcolo
dell’Hessiano), compito che risulta molto gravoso dal punto di vista
computazionale. L’utilizzo di nuove strategie computazionali per il calcolo delle
matrici densità (approccio dei supercofattori7) ha comunque permesso di portare il limite
di applicabilità del metodo spin -coupled a 12 elettroni attivi.
1.2 Separazione core-valenza
Fin dai tempi di Huckel la necessità di semplificare i calcoli connessi alla
determinazione dell’energia e della funzione d’onda associata a un dato sistema ha
portato a separare gli elettroni in due set distinti (core e valenza) trattati con diversi
livelli di approssimazione. Questa suddivisione, in cui si considera che gli elettroni
più interni agiscano esclusivamente come potenziale di schermo sugli elettroni attivi,
ha trovato nel corso degli anni numerose conferme anche dal punto di vista
sperimentale.
L’applicazione di questo principio alla teoria spin-coupled consiste nel descrivere
gli elettroni di core con degli orbitali doppiamente occupati ottenuti da un calcolo
Hartree-Fock preliminare. Introducendo questa approssimazione la funzione può
essere riscritta
[ ]ΨSM Sk
k
f
N N
N
S M k
NN c
S
NV
C v
C V= ⋅⋅ ⋅ ⋅ ⋅ ⋅
=
∑( !) / / , ;1 2
1
1
2
2
2
2
2
1 2 0 0A j j j ff f Q Q (8)
dove le ji rappresentano gli orbitali HF doppiamente occupati, tra di loro
ortogonali e le fi sono gli orbitali spin-coupled degli elettroni di valenza. Come si
vede agli elettroni di core corrisponde un’unica funzione di spin, quella
corrispondente al perfect pairing, e quindi la sommatoria corre solo sugli f SNV (con NV
numero degli elettroni di valenza) possibili accoppiamenti. Di fondamentale
importanza per la semplificazione del problema sono le relazioni di ortogonalità
imposte tra i vari orbitali
j j
j f
f f
i j i j
i j
i j
=
=
≠
δ
0
0
(9)
l’applicazione di queste condizioni semplifica notevolmente la struttura delle matrici
di sovrapposizione SIJ tra gli spin-orbitali
6
S
S
IJ
IJ
V
N NC V
=
1
1 0
0
0 1
1
0
1 2 1
O
K K K
e consente, dopo una serie di passaggi8 di esprimere l’energia come:
[ ]
( ) ( )[ ]
( )
E h g g
h
N N
V V
NN
V
C C
CV
= + − +
+ − +
+
∑ ∑
∑∑
2 2
1
2
1
2 2
2
j j j j j j j j j j
f j f j mn f j f j mn
f f mn
m m
m
m n m n m n n m
m n
m s n s m s s n
sm n
m n
m n
/
,
/
CORE
/
,
MISTO
,
1 244444444444 344444444444
1 244444444444 344444444444∆
∆
D D
D ( )
N
V
NV V
g∑ ∑+
1
2
f f f f mn stm n s t
m n s t
D
, , ,
VALENZA
1 2444444444444 3444444444444
(10)
in cui si evidenzia la presenza di tre termini, uno dipendente esclusivamente dagli
orbitali di core, un termine misto, e l’altro dipendente dagli orbitali di valenza e dalle
corrispondenti matrici densità.
Nell’ottica dell’ottimizzazione dei soli orbitali di valenza il primo termine è una
costante, mentre il secondo può essere riscritto tramite la definizione di un
operatore efficace monoelettronico8 anch’esso costante. La (10) quindi diventa
( ) ( )E E h gCORE
eff V
N
V
NV V
= + +
∑ ∑1 1
2∆
f f mn f f f f mn stm n
m n
m n s t
m n s t
D D
, , , ,
(11)
espressione del tutto analoga alla (7). La separazione core-valenza permette quindi
di trattare molecole che superano i 12 elettroni, con una opportuna partizione
elettronica, come sistemi spin-coupled a NV elettroni, in cui l’effetto del core è
introdotto a livello Hartree-Fock dai termini ECORE e heff che vengono determinati
un’unica volta nelle fasi preliminari del calcolo. Vengono quindi ottimizzati
variazionalmente gli orbitali fi e i corrispondenti f SNV coefficienti spin-coupling,
mantenendo congelati gli orbitali di core.
7
1.2.1 Limitazioni della separazione core-valenza
L’approssimazione frozen core discussa nel precedente paragrafo, pur funzionando
bene in un certo numero di casi6,7,non dà sempre buoni risultati: un esempio è la
rotazione interna dell’allene trattata in questa tesi. Uno dei difetti del funzionale
energia (11) è quello di non essere variazionale rispetto agli orbitali di core ji i quali
oltretutto, provenendo da un calcolo HF, non sono generalmente adatti alla
descrizione della rottura e formazione dei legami chimici. La separazione core-
valenza presenta anche un problema dovuto all’arbitrarietà della partizione degli
orbitali nei due set. I criteri per eseguire questa operazione sono molteplici: le
diverse caratteristiche di simmetria (separazione σ e pi) o le diverse energie
orbitaliche, oppure la scelta si può eseguire, dopo una localizzazione degli MO, in
base alla partecipazione a determinati legami. La scelta volta per volta di diversi
criteri permette sì di trattare separatamente diverse caratteristiche di un sistema ma
la descrizione che si ottiene perde in generalità, senza contare che in molti casi,
anche dopo aver scelto un ben determinato criterio di suddivisione, non si riesce ad
ottenere in modo univoco una partizione soddisfacente.
Una possibile strategia per ovviare al completo congelamento degli orbitali di
core, consiste nell’alternare l’ottimizzazione SC frozen core degli orbitali di valenza e
dei coefficienti csk a un rilassamento degli orbitali di core eseguito mantenendo
fissate le fi. Il metodo non ha dato buoni risultati, presentando una convergenza
molto lenta e una tendenza a raggiungere differenti minimi al variare del guess
iniziale.
Un approccio completamente variazionale al calcolo della funzione d’onda spin-
coupled con separazione core-valenza è stato implementato, con successo, da
Karadakov et altri9. In esso gli orbitali ji e fj e i coefficienti csk vengono ottimizzati
contemporaneamente con una procedura di minimizzazione del secondo ordine,
vincolata con le relazioni di ortogonalità (9).
1.3 Rilassamento completo della funzione d’onda SC
Di seguito verrà presentato un nuovo metodo10 per la correzione
dell’approssimazione frozen core che si pone concettualmente come intermedio tra
l’approccio totalmente variazionale e l’ottimizzazione alternata degli orbitali di core e
valenza. La strategia consiste nell’alternare un conto SC con congelamento degli
orbitali di core, in cui si ottimizzano le fi e i coefficienti spin-coupling, ad un
rilassamento concertato degli orbitali di core e valenza, durante il quale i coefficienti
cSk sono mantenuti fissi. Il processo di rilassamento viene eseguito ricercando una
trasformazione lineare degli orbitali che minimizzi il funzionale energia sotto gli
opportuni vincoli. Questa procedura, nota come minimizzazione diretta, è stata in
precedenza applicata ad altre strategie di calcolo dell’energia con risultati
contrastanti11.
8
I vincoli che gli orbitali devono rispettare, al fine di mantenere valida l’espressione
dell’energia (10) utilizzata nel formalismo della separazione core-valenza, sono i
requisiti di ortogonalità (9) imposti alle componenti spaziali della funzione d’onda
spin-coupled. Per preservare queste condizioni si utilizza un operatore di
trasformazione unitario $U , il nuovo orbitale quindi sarà
′ =f f$U con $ $U U† = 1
e i corrispondenti integrali di sovrapposizione
′ ′ = =f j f j f j$ $U U† (12)
sono quindi invarianti rispetto alla trasformazione. In pratica, tramite l’utilizzo di un
operatore unitario, la trasformazione che si opera sugli orbitali è una rotazione
solidale dell’intero set nello spazio dei coefficienti di espansione degli orbitali.
Va sottolineato che l’utilizzo di una trasformazione unitaria diminuisce
ulteriormente il numero di gradi di libertà del sistema, questo è dovuto alla relazione
(12) che mantiene fisse durante la ricerca del minimo le sovrapposizioni tra gli
orbitali SC. Nel paragrafo 1.1 si è visto che le matrici densità si ricavano tramite una
particolare combinazione lineare, pesata dai coefficienti spin-coupling, dei cofattori
delle matrici di sovrapposizione; ne consegue quindi che la trasformazione unitaria
contemporanea di tutti gli orbitali lascia inalterate le matrici densità durante l’intero
processo di rilassamento. Questa caratteristica, oltre a evitare l’oneroso ricalcolo di
queste matrici, svincola completamente il processo di minimizzazione dalla
conoscenza delle matrici densità di ordine superiore al secondo, riducendo
notevolmente il costo computazionale rispetto a quello necessario per l’approccio
completamente variazionale.
L’alternanza tra il conto SC e la minimizzazione diretta per il rilassamento del
core si rende necessaria al fine di ottimizzare nel processo globale, con una
procedura autoconsistente, gli orbitali di core doppiamente occupati, quelli di
valenza e i coefficienti spin-coupling. L’applicazione di questo procedimento
iterativo ad alcuni sistemi, che tratteremo in seguito, ha permesso di riprodurre
esattamente i risultati ottenuti con la procedura al second’ordine di Karadakov12.
1.3.1 Sviluppo del metodo: definizioni preliminari
Prima di ricavare l’espressione dell’energia da utilizzare per la minimizzazione
diretta è conveniente riformulare questo funzionale in forma matriciale compatta,
sviluppando gli orbitali su base atomica. Introducendo un set di base costituito da
m funzioni reali
( )c = c c c1 2, , ,K m
9
gli orbitali saranno espressi come
( )j = cj j j1 2 2, , , /K NC = ⋅T
( )f = cf f f1 2, , ,K NV = ⋅V
dove T e V sono le matrici dei coefficienti di core e valenza, con dimensioni
m×NC/2 e m×NV rispettivamente. Il generico orbitale ji o fi sarà dato dal prodotto del
vettore c per l’i-esima colonna della matrice dei coefficienti corrispondente.
j
i r ri
r
m
= ∑ c T fi r ri
r
m
= ∑ c V
Inserendo questo sviluppo nella (10), supponendo ∆=1, si ottiene
[ ] [ ]( )
[ ] [ ]( ) ( ) ( )
E r h s r s t u ru t s
r s t u ru t s r h s
V V V
r s
r s
mN
r t s u
r s t u
mN
r sv t u
V
r s t u
mNN
r s
V
r s
mN
r s t
C C
CV V
= + − +
+ − + +
+
∑∑ ∑∑
∑∑∑ ∑∑
2 2
2
1
2
2 2
2
T T T T T T
V V T T V V
m m
m
m n m n
m n
m s s
sm n
m n
m n
m s n
mn mn
,
/
, , ,,
/
, , ,
/
, ,,
| |
| | D D
[ ] ( )V rs tuu
V
r s t u
mNV
t
m n s t
mn st|
, , ,, , ,
D∑∑
(13)
dove gli integrali bielettronici sono stati riscritti in distribuzione di carica,
sottintendendo la presenza dell’operatore g e rappresentando, per semplicità, la r-
esima funzione di base cr tramite il solo indice r.
[ ] ( ) ( ) ( ) ( ) ( )r s t u g rt g sur s t u| ,= =
∗ ∗
∫∫ c c c c1 1 1 2 2 2 (14)
Nei seguenti passaggi si opererà una riscrittura dei vari termini tramite la
definizione di alcune matrici. Innanzi tutto introduciamo le matrici densità su base
atomica, di core D C e di valenza DV
D T TC = † D VdVV = † con [ ]d
ij
V
i j= D ( | )
che nel caso reale sono date da
10
[ ]DC
sr si ri
i
NC
= ∑T T
/2
[ ] ( )DV
sr
V
si rj
i j
NV
= ∑ D i| j V V
,
L’espressione (12) quindi diventa
[ ] [ ]( ) [ ] [ ]( )
[ ] ( )
E r h s rs t u ru t s r s t u ru t s
r h s V V V V rs tu
rs
C
r s
m
rs
C
tu
C
r s t u
m
rs
V
tu
C
r s t u
m
rs
V
r s
m
r s t u
V
r s t u
mNV
= + − + −
+ +
∑ ∑ ∑
∑ ∑∑
2 2 2
1
2
D D D D D
D
, , , , , , ,
, , , ,, , ,
| | | |
|m s n t
m n s t
mn stD
(15)
ed introducendo la matrice dell’Hamiltoniano monoelettronico
[ ]h
sr
r h s=
e la matrice
( )[ ] [ ] [ ]( )G D DC
sr
tu
C
t u
m
rs tu ru ts= −∑ 2 | |
,
la (15) può essere semplificata nel seguente modo
( )[ ] ( )[ ]
[ ] ( )
E
V V V V rs tu
rs
C
sr
r s
m
rs
C C
sr
r s
m
rs
V C
sr
r s
m
rs
V
sr
r s
m
r s t u
V
r s t u
mNV
= + + + +
+
∑ ∑ ∑ ∑
∑∑
2
1
2
D h D D D h
, , , ,
, , ,, , ,
|
G D G D
m s n t
m n s t
mn stD
(16)
I primi quattro termini della (16) rappresentano le tracce dei prodotti tra due
matrici,
( ) [ ]tr
ii
i
ik ki
i k
AB AB A B= =∑ ∑
,
possiamo quindi riscriverla
( ) ( )[ ] ( )[ ] ( )
[ ] ( )
E tr tr tr tr
V V V V rs tu
C C C V C V
r s t u
V
r s t u
mNV
= + + +
+ ∑∑
2
1
2
D h D G D D G D D h
m s n t
m n s t
mn st|
, , ,, , ,
D
(17)
Per poter scrivere in forma compatta anche l’ultimo termine della (17) è
necessario introdurre un particolare formalismo matematico, quello delle
11
supermatrici. Per una maggiore comprensione delle caratteristiche delle supermatrici
e per una trattazione delle operazioni che le coinvolgono si rimanda all’appendice A.
Di seguito nel testo, la distinzione tra matrici e supermatrici verrà effettuata
differenziando le seconde con una tilde (~) posta sopra al loro simbolo.
Innanzi tutto definiamo la supermatrice degli integrali bielettronici
[ ] [ ]
~
,
|X
ij kl
ki lj=
di dimensioni m m2 2×
e quella della matrice densità del second’ordine
[ ] ( )
~
,
|D
ij kl
V
i j k l= D
di dimensioni N NV V2 2×
Il termine della (16) che contiene il prodotto multiplo dei coefficienti di valenza
diventa
1
2
V V V V D
r s t u su rt
r s t u
mN
X
V
m s n t mn st
m n s t
~ ~
, ,
, , ,, , ,
∑∑
ed introducendo il prodotto diretto tra matrici (vedi appendice A) e la supermatrice di
valenza
[ ] [ ]
~
,
,
V V V
ij kl
ij kl ik jl
= × = ⋅V V
di dimensioni m NV2 2×
possiamo scrivere
1
2
~ ~ ~ ~
, , , ,
, , ,, , ,
V V D
rt su su rt
r s t u
mN
X
V
mn st mn st
m n s t
∑∑
riordinando e cambiando l’ordine delle sommatorie si evidenziano i prodotti tra le
supermatrici
12
[ ]
[ ]
1
2
1
2
1
2
~ ~ ~ ~ ~ ~
~
, ,
,
,
,
,
,,
,
,
,
,
,,
,
,
,,
~ ~
~ ~~
V D V V
†
rt
N
su
N
su rt
s u
m
r t
m
rt
su
N
su rt
s u
m
r t
m
rt su su rt
s u
m
r t
m
VV V
X X
X
mn mn st
m n
st
s t
st st
s t
∑∑∑∑ ∑∑∑
∑
⋅
⋅
=
=
=
VD
VDV [ ] ( )[ ]
( )[ ]
∑ ∑ ∑= = =
=
1
2
1
2
1
2
~ ~~ ~ ~ ~~ ~
~ ~~ ~
,
,
VDV VDV
VDV
† †
†
X X
X
rt rt
r t
m
rr
r
m
Tr
tr Tr
In quest’ultima equazione è stato introdotto il simbolo Tr con cui si indica la traccia
di una supermatrice (vedi appendice A).
L’espressione dell’energia per un sistema con separazione core-valenza, sviluppata
su base atomica, risulta quindi
( ) ( )[ ] ( )[ ] ( ) ( )[ ]E tr tr tr tr tr TrC C C V C V= + + + +2
1
2
D h D G D D G D D h VDV~ ~ ~ ~†X (18)
Prima di continuare è utile sottolineare le proprietà di simmetria che, nel caso reale,
caratterizzano matrici e supermatrici presenti nella (18).
La matrice dell’Hamiltoniano monoelettronico è simmetrica per l’Hermitianicità di h
[ ] [ ]h h
sr rs
r h s s h r= = =
DC e DV sono simmetriche
[ ] [ ]D DC
sr
C
rs
= [ ] [ ]D DV
sr
V
rs
=
infatti ( )D T T T T DC C† † † †= = = e similmente per DV.
La supermatrice degli integrali bielettronici possiede, per definizione, due diverse
proprietà di simmetria che si evincono dalla (14), una dovuta alla realtà delle funzioni
c e l’altra all’invarianza dello scambio delle coordinate
[ ] [ ] [ ] [ ]
~ ~
, ,
| |X X
ij kl kl ij
k i lj ik jl= = =
[ ] [ ] [ ] [ ]
~ ~
, ,
| |X X
ij kl ji lk
k i lj lj k i= = =
d’ora in avanti per distinguerle chiameremo la prima, simmetria della supermatrice
~X e la seconda supersimmetria della medesima.
13
Dalle proprietà delle matrici D (in questi passaggi si sottintendono gli apici C o V) e
della ~X deriva la simmetria della matrice G
( )[ ] [ ] [ ]( )G D D
sr tu
t u
m
rs tu ru ts= −∑ 2 | |
,
la definizione può essere riscritta sfruttando la simmetria dei due integrali
[ ] [ ]( )D
tu
t u
m
sr ut ur st2 | |
,
−∑
e la supersimmetria solo sul secondo
[ ] [ ]( )D
tu
t u
m
sr ut st ur2 | |
,
−∑
arrivati a questo punto basta scambiare i due indici t e u della sommatoria per
ottenere l’elemento trasposto
( )[ ] [ ] [ ]( ) ( )[ ]G D D G D
sr ut
u t
m
rs
sr tu su tr= − =∑ 2 | |
,
Infine la supermatrice delle densità al second’ordine possiede, per definizione5, le
medesime proprietà di simmetria di quella degli integrali bielettronici
[ ] [ ]
~ ~
, ,
D D
ij kl kl ij
=
[ ] [ ]
~ ~
, ,
D D
ij kl ji lk
=
1.3.2 Applicazione della trasformazione unitaria
Nel paragrafo precedente gli orbitali sono stati sviluppati sul set di base c, di
dimensioni m, ora introduciamo la matrice U, rappresentazione in questa base
dell’operatore di trasformazione unitaria. Questa matrice agirà sulle rappresentazioni,
nella base corrente, dei singoli orbitali cioè sulle colonne delle matrici dei coefficienti
di core T e valenza V . La trasformazione può quindi essere riscritta in forma
matriciale
′ = ⋅j c T con T U T= ⋅
14
′ = ⋅f c V con V U V= ⋅
Vediamo ora l’effetto della trasformazione sulle matrici che dipendono dai
coefficienti T e V
( )D UT UT U T T U UD U
C C= = =
†
† † †
( )D U Vd U V UVdV U UD U
V V= = =
†
† † †
( ) ( ) ( ) ( )
~ ~V UV U V U U V V U U V= × = × ⋅ × = ×
(per le proprietà del prodotto diretto si veda l’appendice A)
( ) ( )[ ] ( ) ( )
~ ~ ~ ~ ~ ~ ~ ~ ~VDV U U VD U U V U U VDV U U
† †
† †= × × = × ×
Tramite queste relazioni possiamo riformulare l’espressione dell’energia (18) in
funzione della matrice unitaria
( ) ( ) ( )[ ] ( )[ ]
( ) ( ) ( )[ ][ ]
E tr tr tr
tr tr Tr
C C C V C
V
U UD U h UD U G UD U UD U G UD U
UD U h U U VDV U U
= + + +
+ + × ×
2
1
2
†
I
† †
II
† †
III
†
IV
† †
V
~ ~ ~ ~X
(19)
La minimizzazione di questo funzionale richiederebbe l’utilizzo di metodi in
grado di trovare, iterativamente o non, la migliore matrice U unitaria. Gli algoritmi
normalmente utilizzati in chimica computazionale non permettono però di
conservare questa proprietà durante il processo di minimizzazione, anche nel caso in
cui si partisse inizialmente da una matrice unitaria. Per permettere l’uso di questi
algoritmi è quindi necessario avere una procedura che consenta la costruzione di
una matrice unitaria a partire da una matrice X qualsiasi. La funzione utilizzata è la
seguente
U 1 P= − + −2 1 con P 1 X X= + − † (20)
La matrice X conterrà quindi le variabili su cui agiranno le procedure di
minimizzazione, ed è rispetto a questa matrice che verrà ricavata l’espressione del
gradiente. Prima di continuare vanno però sottolineate alcune proprietà della P-1,
15
per la cui dimostrazione rimandiamo all’appendice A in cui viene provata anche la
validità della (20)
La matrice P-1 commuta con il suo aggiunto e con la matrice unitaria
[ ]P P− − =1 1 0, †
(21)
[ ]P U− =1 0,
inoltre vale la relazione
P P U− −=1 1† (22)
1.3.3 Gradiente dell’energia
Prima di derivare l’espressione dell’energia rispetto alla variabile X esprimiamo il
differenziale della matrice unitaria. Data la definizione (20) otteniamo:
( )δ δ δ δ δU P P PP P XP P X P= = − = − +− − − − − − −2 2 2 21 1 1 1 1 1 1† (23)
a) I termini I e IV dell’equazione (19) hanno la stessa forma generale
( )tr UAU h† con A D= C o DV
dato che la traccia è una funzione lineare degli elementi del suo argomento,
l’operatore di derivazione può essere portato all’interno
( ) ( ) ( )δ δ δtr tr trUAU h UAU h UA U h† † †= +
sfruttando l’invarianza della traccia alla trasposizione del suo argomento e la
possibilità di scambiare l’ordine dei prodotti intern i a questo operatore, otteniamo
( ) ( ) ( ) ( ) {δ δ δ δ δtr tr tr tr tr
a b
UAU h UAU h UA U h UAU h h UA U† † † † † † † †= + = +
=1 24 34
( ) {= +
tr tr
b a
δ δUAU h UA U h† † † †1 24 34
che, data la simmetria della h e delle matrici densità di core e valenza, diventa
( ) ( )δ δtr trUAU h UAU h† †= 2
16
inserendo in questa l’espressione (23)
( ) ( ) ( )δ δ δtr tr trUAU h P XP AU h P X P AU h† † † †= − + =− − − −2 2 2 21 1 1 1
sfruttando la relazione (22)
( ) ( )= − + =− − − −2 2 2 21 1 1 1tr trP XP UAU h P X P UAU hδ δ† † † † †
( )= − +
=− − − −4 41 1 1 1tr tr
a b
P XP Ah P X P Ahδ δ† † † †1 24 34 1 24 34
{= −
+
=− − − −4 41 1 1 1tr tr
c d b a
h A P X P P AhP X† † † † † †δ δ1 244 344 1 24 34 1 24 34
{ ( )= −
+ =− − − −4 41 1 1 1tr tr
d c
P h A P X P AhP X† † † † † †δ δ1 244 344
raccogliendo i termini comuni otteniamo
( )= −
− −4 1 1tr P Ah h A P X† † † †δ
Come già detto la matrice h è simmetrica ed è immediato dimostrare che lo è anche
la matrice A , in virtù della simmetria delle matrici densità di core e valenza; infatti
( )A UAU UA U UAU† † † † † †= = =
La derivata dei termini I e IV sarà quindi
( ) ( )[ ]δ δtr trUAU h P Ah hA P X† † †= −− −4 1 1 (G1)
b) Consideriamo ora l’espressione ( )[ ]tr AG B , utilizzando la definizione della
funzione G si ricava un’importante proprietà
( )[ ] ( )[ ] [ ] [ ]( )tr ik tu iu tkik
ki
i k
ik tu
tui k
A G B G B⋅ = = − =∑ ∑∑A A B
, ,
| |2
scambiando gli indici (i ↔ t, k ↔ u) e l’ordine delle sommatorie