144 39 11MB
Italian Pages 335 Year 2011
Indice INTRODUZIONE
7
1 I suoni musicali 1.1 I suoni come onde . . . . . . . . . . . . . . . 1.2 Le note . . . . . . . . . . . . . . . . . . . . .
11 11 17
2 Armonia musicale 2.1 Il sistema musicale europeo . 2.2 Intervalli . . . . . . . . . . . . 2.3 Intervalli semplici e composti 2.4 Rivolti . . . . . . . . . . . . . 2.5 Scale parallele e relative . . . 2.6 Accordi a tre note (triadi) . . 2.7 La notazione musicale . . . . 2.8 Altri sistemi musicali . . . . .
29 29 32 49 49 51 52 54 56
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
3 La Scala di Giusta Intonazione 4 Principi di anatomia e neurofisiologia 4.1 Costituzione dell’orecchio . . . . 4.2 Orecchio esterno . . . . . . . . . 4.3 Orecchio medio . . . . . . . . . . 4.4 Orecchio interno . . . . . . . . . 4.5 Vie nervose . . . . . . . . . . . .
57 . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
69 70 71 73 77 85
3
Indice 4.6 4.7
Battimenti primari e bande critiche . . . . . . Armoniche auricolari e suoni di combinazione
5 Consonanze e dissonanze in giusta intonazione
85 92 95
6 Analisi del sistema a giusta intonazione 113 6.1 Giusta intonazione e temperamenti . . . . . . 113 6.2 Altre scale “giuste” . . . . . . . . . . . . . . . 126 6.3 Intervalli storici . . . . . . . . . . . . . . . . . 130 7 Le consonanze stonate 7.1 Cenni storici e motivazioni . . . . . . . . . 7.2 I battimenti primari . . . . . . . . . . . . 7.3 I BCS nelle consonanze . . . . . . . . . . 7.4 Estensione dei BCS: sintonie ed apotonie 7.5 La modulazione d’ampiezza e i BCS . . . 7.6 La modulazione di fase e i BCS . . . . . . 7.7 BCS per frequenze ad errore ignoto . . . . 7.8 Ipotesi sulla percezione dei BCS . . . . . .
. . . . . . . .
133 134 138 147 164 175 182 184 185
8 Sintonie 8.1 Definizione di sweep . . . . . . . . . . . . . . 8.2 Analisi e sintesi delle sintonie . . . . . . . . . 8.3 La curva delle frazioni . . . . . . . . . . . . .
189 190 192 210
9 Geometrie musicali 9.1 Musica e poligoni regolari . . 9.2 Geometria delle scale . . . . . 9.3 Passi da gigante . . . . . . . . 9.4 Periodicità e divisione in base 9.5 Triadi e triangoli . . . . . . . 9.6 Le curve di Lissajous . . . . .
221 222 238 248 250 252 257
4
. . . . . . 12 . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . . . .
. . . . . .
. . . . . .
Indice 10 Accordi stonati 10.1 Battimenti primari . . . . . . . . . . 10.2 Sintonie ed apotonie negli accordi . . 10.3 Terne giuste uniDSBS . . . . . . . . 10.4 Modulazione d’ampiezza e uniDSBS 10.5 Errori sulle terne uniDSBS . . . . . 10.6 Geometria e terne uniDSBS . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
265 267 272 275 281 283 295
11 Una legge per i BCS 11.1 Fasi . . . . . . . . . . . . . . . . . 11.2 Ampiezze . . . . . . . . . . . . . . 11.2.1 Unisono perfetto . . . . . . 11.2.2 Frazioni . . . . . . . . . . . 11.2.3 Ampiezza minima dei BCS
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
301 304 318 318 320 322
. . . . .
5
INTRODUZIONE a musica non è solo un insieme di suoni. È soprattutto L un insieme di percezioni ed emozioni in grado di trasmettere sensazioni, concetti affettivi, intellettivi e descrittivi, anche molto profondi, tra individui culturalmente affini. Dunque è, in tutto e per tutto, una forma di comunicazione. È una forma di comunicazione non verbale, in grado di accedere direttamente a strutture psicologiche profonde, addirittura spirituali, senza bisogno di passare attraverso la traduzione in forma semantica; la Musica va al di là della parola, la scavalca e arriva senza mediazioni a stimolare emotività, ricordi, speranze, gioia, dubbio, coraggio, paura, affetti ecc. Come esistono differenti lingue nel linguaggio parlato, così esistono differenti forme di comunicazione musicale. Differenti popoli, in differenti zone geografiche del mondo, hanno sviluppato e approfondito, nel corso della loro storia, differenti aspetti del materiale sonoro, determinando i principi base che regolano la manipolazione del suono musicale nella loro cultura odierna e le differenti possibilità e modalità di comunicazione che ne derivano. In Africa è stato sviluppato maggiormente l’aspetto ritmico, in India e Medio Oriente l’aspetto melodico, in Turchia quello metrico e polimetrico, nelle Americhe e in Australia le possibilità timbriche, in Cina e Giappone le capacità descrittive ecc.
7
0 INTRODUZIONE In Europa, è stato soprattutto sviluppato l’aspetto armonico e, con esso, le possibilità sonore e comunicative di due o più suoni presentati contemporaneamente. La comunicazione musicale nella musica di matrice europea si basa dunque sugli effetti fisici ed emotivi dati dall’interazione dinamica di suoni contemporanei. La base di questa interazione è quello che in musica viene definito intervallo armonico, il fenomeno sonoro e percettivo prodotto da due suoni contemporanei. Infatti questi semplici elementi, anche quando presentati singolarmente e al di fuori del contesto di un brano musicale, sono carichi di contenuto comunicativo, allo stesso modo in cui ogni singola parola evoca il suo significato, anche al di là del suo utilizzo specifico in una frase o un discorso completo. Gli intervalli armonici possono essere percepiti come consonanti o dissonanti; queste sensazioni, in verità complesse, possono essere semplificate come «piacevoli» o «spiacevoli». Questa è una notevole riduzione del concetto di consonanza/dissonanza, perché un intervallo dissonante, per esempio, non è necessariamente percepito emotivamente come spiacevole se propriamente inserito nel contesto di un brano musicale, anche breve. Anzi, sono proprio le dissonanze che danno “colore” al materiale musicale avendo una propria carica espressiva. Dunque è proprio il gioco tra consonanze e dissonanze, e la loro manipolazione artistica e creativa, il fulcro della capacità espressiva della comunicazione musicale nella musica di matrice europea. Ancora molto resta da scoprire sui meccanismi che producono la percezione di consonanze e dissonanze e le relative percezioni sensoriali, affettive e intellettive, ma in seguito ad oltre un secolo di ricerca iniziano a delimitarsi alcuni confini interessanti e stimolanti, anche dal punto di vista creativo e artistico. In questa trattazione — dopo aver ac-
8
quisito alcuni concetti fondamentali dell’evento sonoro, della teoria musicale e della anatomia e neurofisiologia dell’apparato uditivo umano — analizzeremo le caratteristiche dei fenomeni di consonanza e dissonanza degli intervalli armonici, integrando le conoscenze finora acquisite dalla ricerca scientifica e proponendo nuove possibilità di analisi dei materiali sonori. Esploreremo in sostanza, partendo dall’analisi del sistema armonico musicale europeo, il mondo delle geometrie fisico– matematiche complesse e interdipendenti dell’interazione tra le onde sonore, che chiameremo Sintonie Musicali.
9
1 I suoni musicali ia i musicisti che i non–musicisti hanno sicuramente un’iS dea, seppur vaga, dell’esistenza e della natura delle note musicali. Dobbiamo però prima di tutto comprendere più a fondo che cosa siano le note musicali nel sistema musicale europeo perché è esattamente il materiale che dovremo analizzare e studiare per addentrarci nei fenomeni di consonanza e dissonanza.
1.1 I suoni come onde Ciò su cui lavoreremo saranno dunque i suoni musicali. Vi sono molti tipi di suoni, quindi è di fondamentale importanza comprendere la differenza tra un suono musicale e tutti gli altri suoni. Ai fini del nostro percorso possiamo dire che alcuni suoni possono essere definiti «rumori», altri semplicemente «suoni generici» e alcuni sono detti «suoni musicali». La differenza tra questi tre tipi di suoni è naturalmente intuitiva e immediata, e difficilmente potremmo confondere un rumore con un suono musicale (a parte le sperimentazioni di musica concreta e classica contemporanea), ma è molto utile analizzare le differenze oggettive che esistono tra di loro.
11
1 I suoni musicali Innanzitutto cerchiamo di definire in poche e semplici parole che cosa è un suono. Un suono è un evento fisico, che per realizzarsi necessita di una fonte sonora e di un mezzo di propagazione. La fonte sonora è sostanzialmente un evento fisico che è in grado di perturbare la quiete del mezzo in cui si propaga e che, vibrando, induce nel mezzo di propagazione una serie di onde, simili a quelle che si formano sulla superficie del mare o di un lago. Se, per esempio, battiamo le mani sentiremo uno schiocco: abbiamo perturbato la quiete dell’aria intorno a noi e le onde prodotte dal battito delle nostre mani si sono propagate nell’aria fino al nostro orecchio e da questo al nostro cervello che ha interpretato l’evento come suono, facendocelo percepire coscientemente. Ma esistono moltissimi mezzi di propagazione. Per esempio, i subacquei sanno molto bene che sott’acqua è possibile sentire il rumore di una nave che si muove in superficie. Le vibrazioni prodotte dai motori della nave e dall’acqua spostata con violenza dalle pale producono onde nell’acqua che nuovamente possono propagarsi fino al nostro orecchio. Ma ancora, se appoggiamo l’orecchio sulla superficie di una tavola di legno, di metallo o di plastica e la percuotiamo in un altro punto con un oggetto, sentiremo un rumore sordo e molto ben definito. Anche in questo caso, la percussione della tavola ha prodotto una serie onde che si sono propagate lungo la tavola stessa fino al nostro orecchio appoggiato su di essa. Dunque, qualunque elemento fisico (gassoso come l’aria, liquido come l’acqua o solido come una tavola di legno) può essere un mezzo di propagazione di un’onda sonora prodotta da una fonte. Possiamo perciò dire che i suoni sono onde, e quindi come
12
1.1 I suoni come onde tali possono essere rappresentate. Le onde hanno due caratteristiche fondamentali: l’ampiezza e la frequenza. L’ampiezza è l’entità dello spostamento indotto dall’onda stessa. La frequenza è il numero di spostamenti (onde) che si verificano in un determinato lasso di tempo e si misura in Hertz (simbolo: Hz) che indica quante volte in un secondo una determinata “particella” del mezzo di propagazione si sposta dalla sua posizione iniziale e vi ritorna. Quindi, se parliamo di un suono a 440 Hz stiamo dicendo che si verificano 440 vibrazioni in un secondo. La più comune rappresentazione di un onda sonora è su un grafico in cui alle ascisse è rappresentata l’intensità e alle ordinate il tempo (figura 1.1). Quindi la linea ondulata che vedremo rappresenta in sostanza il comportamento nel tempo di una singola particella (o di un gruppo omogeneo di particelle) del mezzo di propagazione perturbata dall’onda sonora. Per fare un parallelo, è come se osservassimo una pallina che galleggia sulla superficie del mare e si muove verticalmente (ma non orizzontalmente) a causa delle onde: se su questa pallina applicassimo una matita (parallela alla superficie del mare) e facessimo scorrere un foglio sulla punta della matita (perpendicolarmente ad essa) otterremmo una linea ondulata, il cui significato è esattamente identico a quello della rappresentazione di un’onda sonora di cui abbiamo appena parlato: l’ampiezza sarà determinata dall’entità dello “spostamento verticale” della pallina e quindi dalla distanza tra l’apice superiore (o inferiore) e la posizione di quiete di ogni porzione dell’onda disegnata sul foglio; la frequenza sarà invece determinata da quante volte in un secondo la pallina si muove verticalmente e quindi dalla “vicinanza” o “lontananza” tra due creste successive nell’onda disegnata. In realtà la “distanza” temporale tra due creste è il periodo (T ), che matematicamente è esattamente uguale all’inverso
13
1 I suoni musicali della frequenza ν:
1 T il che significa che più le creste sono vicine più alta è la frequenza e viceversa. ν=
Figura 1.1: Rappresentazione del suono sul piano cartesiano
Dal punto di vista musicale, date due frequenze ν1 e ν2 , si dice più grave la frequenza minore e più acuta la frequenza maggiore. Qui di seguito, sono riportati i grafici di tre suoni molto diversi tra di loro, rappresentati come onde. Nella figura1.2a, è rappresentato un rumore, in particolare il rumore di un trapano. In figura1.2b, è rappresentato un suono generico e, in particolare, è la voce di un uomo (l’autore) che pronuncia la parola «suono». In figura1.2c, è invece rappresentato un suono musicale, in particolare il suono prodotto dalla corda di una chitarra. Già a prima vista notiamo che i tre grafici sono molto differenti, ma se guardiamo più da vicino, “zoomando” in un
14
1.1 I suoni come onde
(a)
(b)
(c) Figura 1.2: Oscillogramma di: un rumore (a), un suono generico (b) e un suono musicale (c)
punto qualunque lungo l’asse delle ordinate (il tempo), le differenze sono ancora più evidenti. La più grande e la più importante differenza che possiamo notare è l’estrema “regolarità” dell’onda rappresentante il suono musicale (fig. 1.3c), totalmente assente nel rumore che è completamente irregolare (fig. 1.3a) e solamente parziale nel suono generico (fig. 1.3b). La voce può comportarsi come suono musicale se acquista la regolarità tipica del canto.
15
1 I suoni musicali
(a)
(b)
(c) Figura 1.3: Dettaglio dell’oscillogramma di: un rumore (a), un suono generico (b) e un suono musicale (c)
È questa, in realtà, la caratteristica che differenzia oggettivamente un suono musicale da tutti gli altri suoni: il suono musicale è regolare. Da questa regolarità dei suoni musicali dipende tutta la costruzione del nostro sistema musicale. Suoni così costituiti sono chiamati onde periodiche.
16
1.2 Le note
1.2 Le note Ora possiamo cominciare a rispondere a due domande: cosa sono le note? E quante sono? Rispondere alla prima domanda è semplice: le note sono singoli suoni musicali, sono i “mattoni” di cui è composta tutta la musica. Rispondere alla seconda domanda è invece più difficile. Qualcuno starà pensando, forte di nozioni teoriche e magari anche pratiche, che le note sono 7; qualcun altro, più esperto, penserà che siano 12; qualcun altro ancora penserà 8, oppure 5. . . Con un approccio moderno alla musica (e soprattutto, al fine della nostra trattazione), nessuna di queste risposte è esatta. Le note non sono né 5, né 7, né 8, né 12, né alcun altro numero: le note sono infinite. Il che, attenzione, non significa che siano illimitate, quindi non significa che (in frequenza) vadano da 0 Hz a +∞ Hz: il nostro orecchio è molto limitato nella percezione dei suoni e possiamo distinguere soltanto suoni compresi tra circa 20 Hz e 20 000 Hz, ma sono comunemente considerati suoni musicali (quindi “note”) solo quelli compresi tra circa 30 Hz e 4000 Hz1 . Questo limite dipende dal potere di discriminazione tonale dell’orecchio umano, che corrisponde alla capacità di ricono1 Per
la precisione, è facilmente verificabile che un pianoforte a 88 tasti può riprodurre suoni di frequenze comprese tra 27.5 Hz e 4224 Hz; suoni di frequenza inferiore o superiore non sono comunemente considerati musicalmente utili (tranne rari casi come l’octobasso, di cui parleremo più avanti, o le produzioni di musica sperimentale, in special modo di musica elettronica). La voce umana copre un ambito di frequenze tra i 60 Hz, limite inferiore del basso, e 2000 Hz, limite superiore del soprano.
17
1 I suoni musicali scere suoni di differente frequenza2 . Allora in che senso le note sono infinite? Per fare un parallelo, si può pensare alla differenza che c’è tra l’insieme dei numeri naturali e quello dei numeri reali. L’insieme dei numeri naturali è formato da punti isolati, infatti tra 0 e 1, tra 1 e 2, tra 2 e 3 ecc. pertanto tra due numeri contigui, non esistono altri numeri. Questo è quello che, in matematica, viene chiamato insieme discreto. Nell’insieme dei numeri reali invece, presi due numeri (o punti) qualunque ne esiste sempre un terzo tra di loro. Questo è quello che in matematica viene chiamato insieme continuo, che è un insieme di punti tali per cui presa una coppia di punti esiste sempre almeno un numero che sia maggiore di quello più piccolo e minore di quello più grande. Per esempio, tra 0 e 1 esiste 0.5; tra 0 e 0.5 esiste 0.25; tra 0 e 0.25 esiste 0.125; potremmo continuare così all’infinito e troveremmo sempre un numero compreso tra i due che abbiamo scelto, per quanto piccoli siano. Le note sono fatte esattamente così: sono un insieme continuo, limitato (da 30 Hz a 4000 Hz) ma infinito. Tra tutte le note possibili, ciascuna cultura ne ha scelte alcune con le quali ha costruito il proprio sistema musicale. In questo libro ci occuperemo soltanto del sistema musicale occidentale, quindi ci interessa ora comprendere come, in Europa, siano state storicamente scelte le note da usare in tutto l’insieme infinito di note di cui possiamo disporre. Il primo criterio che è stato utilizzato (quello più importante) 2 Per
suoni compresi tra i 100 e 4000 Hz, possono essere discriminate variazioni tonali pari a circa lo 0.2 percento della frequenza che è una percentuale accettabile dato il modo in cui è costruito il nostro sistema musicale (che vedremo nel dettaglio in seguito). Al di sotto dei 100 Hz e al di sopra dei 4000 Hz, la soglia di discriminazione si innalza fino a superare i limiti accettabili: per esempio a 8000 Hz la soglia sale allo 0.6 % il che ci farebbe percepire come stonata una nota di frequenza corretta.
18
1.2 Le note si basa su una caratteristica fisica dei suoni musicali di cui ancora non abbiamo parlato: il secondo armonico. I suoni reali, realmente esistenti in natura (cioè, non prodotti elettronicamente), non sono costituiti da “una sola frequenza”, anche se una sola è quella che noi percepiamo coscientemente, la frequenza quella più grave (cioè, di frequenza minore) e che usiamo per “dare il nome” alla nota o per determinare la frequenza stessa della nota in questione. Il fatto è che, qualunque cosa vibri in natura, non vibra in una sola modalità o con un solo tipo di movimento, ma la sua vibrazione totale è la somma di una serie di vibrazioni ben precise che (per le onde regolari come appunto i suoni musicali) vengono chiamate armonici. La frequenza più bassa, quella che noi percepiamo coscientemente, viene chiamata frequenza fondamentale o armonico fondamentale o primo armonico. Come già abbiamo detto è quella che viene usata per “chiamare” la nota e per definirne la frequenza. Ma, se analizzassimo con uno spettrografo il suono prodotto per esempio dalla corda di una chitarra, noteremmo che vi sono molte altre frequenze: se chiamassimo ν la frequenza fondamentale, registreremmo una frequenza aggiuntiva pari a 2ν e un’altra ancora pari a 3ν, un’altra pari a 4ν, un’altra pari a 5ν ecc. sebbene di ampiezza minore rispetto alla fondamentale. Tutte queste frequenze aggiuntive sono appunto gli armonici. Avendo chiamato la frequenza più bassa primo armonico di frequenza ν, ne consegue che la prima frequenza aggiuntiva che troviamo, quella pari a 2ν, sarà il secondo armonico; la terza, pari a 3ν, sarà il terzo armonico, e così via. Per esempio, una corda tesa fissa ad entrambe le estremità (come la corda di una chitarra o di un basso ecc.) vibra principalmente in questo modo:
19
1 I suoni musicali
dove i due punti di fissaggio sono rappresentati dal capotasto e dal ponte (o dal ponticello) e questa vibrazione produrrà la frequenza ν, la frequenza fondamentale, cioè la frequenza della nota che vogliamo suonare. Ma quella corda, per le proprietà fisiche del moto ondulatorio, vibrerà anche in queto modo:
ed entrambi i ventri, essendo la loro lunghezza pari alla metà della corda stessa, produrranno la frequenza 2ν, il secondo armonico. Ma vibrerà anche nei seguenti modi:
con frequenza 3ν;
con frequenza 4ν;
20
1.2 Le note con frequenza 5ν;
con frequenza 6ν ecc. In sostanza una corda, quando pizzicata, vibrerà con un movimento complesso che deriva dalla sommatoria di tutte le singole componenti (gli armonici) del suono in questione. Se fotografassimo una corda mentre vibra otterremmo dunque un pattern complesso simile a quello in figura 1.4.
Figura 1.4: vibrazione di una corda
Tutto ciò è valido per qualunque cosa vibri in modo regolare in natura3 . In alcuni casi specifici la composizione in armonici può essere meno ricca; è il caso, per esempio, del flauto di pan, costituito da una canna aperta ad una sola estremità, o di una corda fissata ad una sola estremità, in cui vengono prodotti solo gli armonici dispari; è quello che 3 In
realtà, i suoni prodotti dagli strumenti a corda non sono così regolari a causa del fenomeno della inarmonicità, che avviene perché una corda reale vibrando aumenta lievemente la propria lunghezza e dunque gli armonici risultano crescenti, quindi di frequenza maggiore rispetto a quella teorica.
21
1 I suoni musicali accade anche nel caso della cavità orale umana che, in prima approssimazione, si può considerare aperta all’altezza della bocca e del naso e chiusa a livello delle corde vocali. Al fine della nostra trattazione, considereremo i suoni naturali con la massima densità di armonici, in cui siano presenti tutti i multipli della frequenza fondamentale. Con uno spettrografo, possiamo facilmente evidenziare tutti gli armonici presenti in un suono naturale. Iniziamo dallo spettrogramma di un suono puro. Si dice puro un suono che contiene una sola frequenza, quindi un suono senza armonici. Un suono di questo tipo non è un suono naturale, non esiste in natura, ma deve essere ottenuto elettronicamente con programmi specifici per la manipolazione sonora. Qualcosa di molto simile ad un suono puro, può essere ottenuto anche con espedienti tecnici, per esempio con la costruzione ad hoc, di un diapason (figura 1.5), i cui rebbi vibrano quasi ad una singola frequenza.
Figura 1.5: diapason
Se analizzassimo con uno spettrografo il suono di un diapason, sarebbe possibile notare anche la presenza del secondo
22
1.2 Le note armonico e di qualche armonico superiore, sebbene di ampiezza minore rispetto all’armonico fondamentale. Se invece analizziamo lo spettrogramma di una A a 110 Hz, creato elettronicamente, noteremo il singolo picco di frequenza sui 110 Hz (fig. 1.6).
Figura 1.6: A puro da 110 Hz
Figura 1.7: A 110 Hz di una chitarra
Il suono prodotto dal A grave di una chitarra (110 Hz) produrrà un grafico molto più complesso, in cui saranno visibili tutti i picchi corrispondenti a tutte le frequenze degli armonici del suono prodotto (fig. 1.7).
23
1 I suoni musicali
Figura 1.8: A 110 Hz di un saxofono
Come previsto infatti, ciascun picco di frequenza è un armonico della frequenza fondamentale di 110 Hz. Uno stesso suono prodotto da strumenti musicali diversi, sarà composto dalle frequenze dei medesimi armonici, ma l’ampiezza di ciascuno di essi potrà essere differente, determinando una delle caratterische proprie di quello strumento (il timbro, vedi oltre). Lo spettrogramma di un A 110 Hz di un saxofono risulterà dunque diversamente composto. Come possiamo notare dalla figura 1.8, la differenza nello spettro è ben visibile. Confrontiamo ora i precedenti spettrogrammi, con quello di un rumore (fig. 1.9). Non notiamo qui alcun picco, ma la confusa e informe presenza di moltissime frequenze senza un schema preciso. Gli armonici sono, come accennato precedentemente, di somma importanza nella caratterizzazione del timbro di ciascuno strumento musicale. Ma non solo: quando regoliamo l’equalizzazione del nostro impianto d’ascolto (hi-fi, lettore cd o lettore mp3 ecc.) e maneggiamo la manopola dei bassi, stiamo agendo sulle frequenze più gravi, mentre quando
24
1.2 Le note
Figura 1.9: Spettrogramma di un rumore
modifichiamo la regolazione degli alti, agiamo sulle note più acute. Dato che ogni singolo suono musicale che il nostro impianto sta riproducendo, a causa del fenomeno degli armonici, è costituito sia da basse che da alte frequenze, noi stiamo agendo sul timbro di ciò stiamo ascoltando. Sappiamo inoltre, per esempio, di essere in grado di distinguere centinaia se non migliaia di voci umane diverse e addirittura l’analisi vocale può essere utilizzata come prova in procedimenti penali ecc. Questo perché il timbro della voce di ogni persona è unico ed è impossibile da contraffare, esattamente come le impronte digitali. L’ampiezza di ciascun armonico per ciascun suono prodotto dalla fonazione di un individuo è assolutamente unica ed è causata da molteplici fattori anatomici e comportamentali dell’individuo stesso. Questo è valido ovviamente anche per gli strumenti musicali. Quindi, possiamo dire che qualunque suono naturale di interesse musicale (ma non solo) è un insieme di frequenze le quali hanno, con la frequenza più grave che chiameremo fondamentale, un rapporto pari a H · ν, dove ν è la frequenza della fondamentale e H è un numero intero positivo. L’onda
25
1 I suoni musicali che descrive la somma di tutte queste frequenze e dunque anche l’effettiva composizione armonica di un suono, è chiamata Trasformata di Fourier ed è pari, semplificando, alla sommatoria di tutte le componenti armoniche di un suono, ciascuna con la propria ampiezza e ne definisce il cosiddetto spettro che è per l’appunto la composizione in armonici del suono. Lo spettro determina la forma dell’onda. La traformata di Fourier è usata in disparati campi scientifici per l’analisi e la sintesi delle onde, non solo sonore. Non ce ne occuperemo nel dettaglio in questa trattazione dato che useremo strumenti matematici molto più semplici. Dunque il timbro può identificare un genere specifico di strumento musicale e anche un singolo strumento all’interno dello stesso genere. In realtà il timbro di un suono non dipende solo dalla composizione degli armonici (spettro armonico), ma anche dall’inviluppo dell’onda, dalla sua “forma macroscopica”. L’inviluppo è in realtà una curva geometrica, che segue il profilo di un onda ed è contemporaneamente tangente a tutti i picchi dell’onda (o a tutti i picchi positivi o negativi). Vediamo un’onda reale e il suo inviluppo, in particolare il suono di un pianoforte che suona un accordo di C69 (fig. 1.10) Osserviamo quindi l’onda (l’insieme di picchi positivi e negativi) e il suo inviluppo rappresentato dalla sua forma più esterna. L’inviluppo si divide in quattro fasi: 1. Attacco (attack ): ogni strumento musicale ha un proprio attacco, corrispondente a quella fase iniziale prima che l’onda sonora diventi stabile; in una chitarra è per esempio dato dal plettro che pizzica la corda 2. Decadimento (decay): è anch’essa una fase iniziale e consiste in una breve riduzione dell’intesità propria di
26
1.2 Le note
Figura 1.10: caratteristiche del timbro
ogni strumento, in cui le parti fisiche coinvolte (per esempio le casse armoniche) iniziano ad entrare in risonanza con il suono prodotto 3. Tenuta (sustain): è la fase centrale, in cui l’intensità si mantiene pressocchè stabile 4. Rilascio (release): è l’ultima fase, in cui il suono perde più o meno velocemente d’intensità fino al silenzio Utilizzeremo largamente il concetto di inviluppo, anche se applicato a suoni puri, più avanti. Per ora possiamo iniziare a definire il significato musicale del rapporto tra il primo armonico e il secondo, nelle onde armoniche: come detto, questo rapporto è pari a 2, quindi il secondo armonico ha frequenza pari al doppio del primo (e il primo ha frequenza pari alla metà del secondo). Dobbiamo ora introdurre un concetto molto importante e di cui parleremo più estesamente nel prossimo capitolo: l’intervallo. Il rapporto tra due note è detto intervallo. L’intervallo tra due note le cui frequenze siano in rapporto pari a 2 (l’una il doppio o la metà dell’altra) è detto ottava,
27
1 I suoni musicali e le due note vengono chiamate con lo stesso nome. Quindi se, per esempio, chiamiamo «La» la nota con frequenza pari a 440 Hz, possiamo dire che una nota pari a 880 Hz (= 2 · 440) sarà sempre un «La» e formerà con essa un intervallo di ottava, al pari di una nota a 220 Hz (= 440/2) che sarà sempre un «La» e formerà anch’essa con il La a 440 Hz un intervallo di ottava. 220 Hz La
440 Hz La
880 Hz La
pertanto: ν/2 stesso nome
ν stesso nome
2·ν stesso nome
Generalizzando questa regola possiamo dire che, data una nota X di frequenza ν, tutte le note di frequenza pari a 2n ν saranno chiamate con lo stesso nome della nota X e formeranno con questa un intervallo di n ottave. Iniziamo quindi a vedere che l’insieme infinito di note inizia ad essere suddiviso in sottoinsiemi più piccoli e ordinati secondo un preciso criterio (la ratio 2n ν), chiamati ottave. Nel prossimo capitolo, ci addentreremo più a fondo nell’armonia musicale, per acquisire tutte le conoscenze necessarie per analizzare gli intervalli musicali.
28
2 Armonia musicale er comprendere la natura di consonanze e dissonanze PL’armonia è necessario introdurre le basi dell’armonia musicale. è lo studio del significato e dei rapporti tra le
note di un determinato sistema musicale. Noi ci occuperemo esclusivamente del sistema musicale europeo.
2.1 Il sistema musicale europeo Abbiamo visto che le note sono suoni, resi “speciali” da alcune caratteristiche fisiche. Nel sistema musicale europeo, le note sono suddivise in ottave. Ogni ottava contiene 12 note di cui 7 hanno un nome proprio e 5 prendono il nome della nota precedente seguita da � (diesis) o della nota successiva seguita da � (bemolle). I � e i � sono detti accidenti o alterazioni. Il rapporto tra due note contigue, vale a dire tra una nota e quella immediatamente successiva o precedente, è detto semitono (st). Due semitoni formano un tono (T). Quindi si può dire che un’ottava è formata da 12 semitoni oppure da 6 toni. Abbiamo detto che alcune note, sette, hanno un nome proprio. Le note con un nome proprio sono quelle della Scala Maggiore Naturale di Do. In ordine, dalla più grave alla più acuta sono: C (Do), D (Re), E (Mi), F (Fa), G (Sol), A (La), B (Si). In questa trattazione utilizzeremo prevalentemente la
29
2 Armonia musicale notazione in sigle, essendo l’attuale notazione internazionale: Do Re Mi Fa Sol La Si
⇒ ⇒ ⇒ ⇒ ⇒ ⇒ ⇒
C D E F G A B
Una scala è una sequenza determinata di note, scelte in base a precisi criteri o schemi. Le note della Scala Maggiore Naturale di C sono scelte nell’ottava C�C (da un Do al Do dell’ottava immediatamente superiore, quindi da un Do di frequenza νC al Do di frequenza 2νC ) secondo lo schema T�T�st�T�T�T�st. Immaginando di vedere la tastiera di un basso o di una chitarra, possiamo visualizzare la Scala Maggiore Naturale di C in questo modo:
Vediamo che tra C e D, D e E, F e G, G e A, A e B, c’è un tono (due semitoni), mentre tra E e F, B e C, c’è un semitono. Le altre note prendono il nome della nota immediatamente precedente o successiva seguita dall’alterazione corrispondente. Quindi la nota compresa tra C e D potrà chiamarsi C� oppure D� (questo è vero nell’attuale temperamento equabile ma non è sempre stato così; ne parleremo in sede di approfondimento storico). Quindi, completando lo schema otteniamo:
30
2.1 Il sistema musicale europeo
Questo insieme completo di 12 note entro un ottava si chiama Scala Cromatica e prende il nome della prima nota della Scala. In questo caso è la Scala Cromatica di C. Le note che hanno un nome proprio, senza alterazioni, sono chiamate naturali mentre le altre sono definite come accidenti. Le note naturali corrispondono ai tasti bianchi del pianoforte e alle note scritte sul pentagramma senza alterazioni (senza � o �), mentre gli accidenti ai tasti neri e alle note con alterazioni sul pentagramma. Una scala può essere suonata e/o concepita come Ascendente (dalla nota più grave alla nota più acuta) o Discendente (dalla nota più acuta a quella più grave). Per convenzione, nella Scala Cromatica Ascendente per le note non naturali (gli accidenti) si usano solo �, mentre nella Scala Cromatica Discendente si usano solo �. Per evitare ambiguità, in questa esposizione utilizzeremo il segno � per indicare un intervallo (ascendente, dove non altrimenti specificato) tra due o più note. Le note delle ottave C�C successive avranno lo stesso nome, la stessa sequenza e organizzazione; lo stesso vale per le note delle ottave precedenti e quindi per tutte le ottave del nostro sistema musicale. Questo concetto molto importante si chiarirà man mano nel corso dell’esposizione. Vediamo ora, per esempio un’ottava D�D (da Re a Re) e un’ottava F��F� (o G��G�):
31
2 Armonia musicale
Notiamo che le note “che hanno un nome” (naturali) rimangono sempre e comunque quelle definite in precedenza e sono le note della Scala Maggiore Naturale di C, indipendentemente dalla nota da cui partiamo e dall’ottava in cui siamo. Rimangono anche alla stessa “distanza” tra di loro: tra B�C e E�F c’è sempre un semitono mentre tra tutte le altre note naturali contigue c’è un tono.
2.2 Intervalli Un intervallo è il rapporto tra due note. Gli intervalli possono essere melodici se si riferiscono a due note suonate una dopo l’altra (non contemporaneamente) mentre si dicono intervalli armonici se si riferiscono a due note suonate contemporaneamente. Gli intervalli melodici possono essere Ascendenti o Discendenti (come le Scale). Uno specifico intervallo può essere definito in due modi: • a toni e semitoni (T/S) • in senso armonico Per esempio in T/S, l’intervallo C�F è di 5 semitoni (o 2 toni e 1/2), l’intervallo D�E è di 2 semitoni (o 1 tono), l’intervallo F��A è di 3 semitoni (o 1 tono e 1/2) ecc. Per calcolare
32
2.2 Intervalli un intervallo in T/S è sufficiente contare lungo la scala cromatica quante note separano le due note che lo formano, escludendo dal calcolo la prima. Per esempio, per calcolare in T/S l’intervallo G�B, conteremo G�, A, A�, B, quindi 4 semitoni (2 toni). Oppure si possono contare, nello schema, quanti spazi (che rappresentano proprio i semitoni ) separano le due note dell’intervallo. Da notare è che, laddove non chiaramente specificato, quando si indica un intervallo lo si intende Ascendente (infatti abbiamo usato i � lungo la Scala Cromatica Ascendente). Quando è Discendente è necessario specificarlo. Quando è armonico, non è necessario specificarlo (ma è consigliabile) e si calcola come Ascendente (a meno ché non sia altrimenti specificamente richiesto). Se avessimo un intervallo melodico discendente, dovremmo fare esattamente lo stesso calcolo ma all’inverso lungo la Scala Cromatica Discendente (e quindi usare i �). Per esempio, calcoliamo in T/S l’intervallo melodico discendente A�C. In questo caso è il A la nota più acuta e dobbiamo scendere fino a C, quindi: A�, G, G�, F, E, E�, D, D�, C. Dunque l’intervallo sarà di 9 semitoni, 4 toni e 1/2. Parallelamente, data una nota e un intervallo, se vogliamo sapere quale nota formerà l’intervallo desiderato con la nota data, basterà aggiungere (o togliere, nell’intervallo melodico discendente) i semitoni dati alla nota di partenza. Per esempio, quale nota forma con il G� un intervallo melodico ascendente di 2 semitoni? Calcoliamo A, A�: quindi sarà il A�. Oppure, quale nota forma con il E un intervallo melodico discendente di 2 toni? Calcoliamo 4 semitoni dal E: E�, D, D�, C, quindi sarà il C. Questa notazione, sebbene precisa, rende conto solo della “distanza” tra due note e del loro rapporto in toni e semitoni, ma non del loro significato reciproco, che è poi quello che realmente interessa dal punto di vista armonico e musicale in
33
2 Armonia musicale genere. Per comprendere il significato delle note e iniziare a studiare gli intervalli in senso armonico, dobbiamo riprendere la Scala Maggiore Naturale di C e analizzarla più a fondo.
Notiamo che è formata da 7 note, più il C dell’ottava successiva. La maggior parte delle Scale è formata in questo modo (7 note più l’ottava), ma alcune sono di 6, altre di 5, altre di 8 ecc. Quindi, quando si elencano le note di una Scala, è bene sempre concludere con la prima nota dell’ottava successiva (che deve necessariamente avere lo stesso nome della prima), così da avvisare che la Scala è completa. In questa sede utilizzeremo solo Scale a sette note. Le note di una Scala vengono numerate da 1 a 8, secondo la loro posizione, dalla più grave alla più acuta, tenendo conto che la 8 è sempre la prima nota dell’ottava successiva e quindi ha sempre lo stesso nome della 1 (senza eccezioni).
In questo senso, possiamo dire che il F è la 4 (quarta) del C, oppure che il A è la 6 (sesta) del C ecc. Dunque, in questa visione, tutti gli intervalli sono riferiti solo alla 1 (prima) che diventa la nota più grave di otto intervalli: gli intervalli di prima, seconda, terza, quarta, quinta, sesta, settima e ottava. Ma la Scala Maggiore Naturale di C non è solo, come abbiamo visto, il punto di partenza per definire la note naturali
34
2.2 Intervalli (quelle con un nome proprio): è anche la base delle Scale Maggiori, ovvero definisce lo schema delle Scale Maggiori.
Se vogliamo, per esempio, trovare la Scala Maggiore Naturale di D, ci basterà prendere lo schema della Scala Maggiore Naturale e giustapporvi le note della Scala Cromatica di D:
Quindi le note della Scala Maggiore Naturale di D saranno quelle che cadono sugli asterischi; in altre parole, la Scala Maggiore Naturale di D dovrà corrispondere allo stesso schema in T/S della Scala Maggiore Naturale di C: T�T�st�T�T�T�st. Ci troviamo però di fronte a un problema: in questa Scala Maggiore Naturale di D, come chiamiamo la terza? F� oppure G�? E la settima? La regola è che in tutte le Scale (tranne pochissime eccezioni che non affronteremo qui) ogni nota, così come è definita da un numero ordinale univoco (c’è una sola seconda, una sola terza ecc.) deve anche essere definita da un nome univoco. Quindi le note di una scala, alterazioni a parte, devono avere un nome univoco, ordinate dalla più grave alla più acuta secondo i nomi stabiliti delle note naturali, è necessario quindi conservare la sequenza delle note naturali. Dunque, tralasciando per ora le alterazioni (� e �), le note della Scala Maggiore Naturale di D del nostro esempio, dovranno chiamarsi
35
2 Armonia musicale in ordine: D (prima), E (seconda), F (terza), G (quarta), A (quinta), B (sesta), C (settima) e D (ottava). Sapendo questo, applicheremo le alterazioni laddove sono necessarie per dare il giusto nome completo alla nota specifica. Quindi, la terza della Scala Maggiore Naturale di D, dovrà chiamarsi per forza F (perché il E è la seconda e il G è la quarta, in ordine). Dovremo perciò chiamarla F�, dato il F naturale non è compreso nello schema della Scala Maggiore Naturale. La stessa cosa vale per la settima, che si chiamerà dunque C�. Ecco infine la Scala Maggiore Naturale di D al completo
Questo meccanismo è valido per tutte le Scale (tranne rare eccezioni, come accennato in precedenza). Proviamo quindi a scrivere la Scala Maggiore Naturale di E�. Prima di farlo, decidiamo che nomi dovranno avere le note, in modo da risolvere eventuali problemi legati ai nomi degli accidenti: E (prima), F (seconda), G (terza), A (quarta), B (quinta), C (sesta), D (settima) e E (ottava). Ora applichiamo la Scala Cromatica di E� allo schema per la Scala Maggiore Naturale:
Diamo il giusto nome alle note “ambigue” e togliamo quelle non necessarie:
36
2.2 Intervalli
Ed ecco quindi Scala Maggiore Naturale di E�. Note che possono avere nome diverso, ma che corrispondono allo stesso suono sono chiamate omofone o enarmoniche. Sono omofone, per esempio, il C� e il D�, il A� e il G� ecc. Ma anche il B� e il C, dato il � aumenta di un semitono la nota a cui si applica: aumentando di un semitono il B, si ottiene il C. Quindi anche il F� e il E sono omofone, perché il � diminuisce di un semitono la nota a cui si applica. Sono enarmonici anche il G e il F�� (che si legge «Fa doppio diesis»; il doppio diesis si scrive anche con un simbolo simile ad una « x »), come anche il B�� (doppio bemolle) e il A ecc. Quando è necessario specificare graficamente che una nota è naturale (senza accidenti) si usa il simbolo di bequadro �. Il solo numero ordinale, però, non basta a descrivere la funzione e la posizione della nota all’interno di una Scala (o di un intervallo). Il numero ordinale è sempre accompagnato da un attributo che specifica più dettagliatamente il senso armonico dell’intervallo e che dipende anche dalla sua definizione in T/S. Per motivi che vedremo tra breve, la prima, la quarta, la quinta e l’ottava di una Scala Maggiore Naturale sono dette giuste o perfette (e si indicano col simbolo P, perfect). Tutti gli altri intervalli sono detti maggiori (e si indicano con M maiuscola). Dunque, lo schema della Scala Maggiore Naturale, si completa in questo modo:
37
2 Armonia musicale D’ora in poi dovremo sempre specificare non solo il numero ordinale, ma anche l’attributo. Cominciamo a vederne il perché, osservando come è fatta una Scala Minore Naturale. Lo schema T/S della Scala Minore Naturale è T�st�T�T�st�T�T, quindi:
Le note che cadranno sugli asterischi saranno le note della Scala Minore Naturale. Alcune posizioni (intervalli) le conosciamo già: la 1P, la 2M, la 4P, la 5P e la 8P sono le stesse della Scala Maggiore Naturale. Dunque, restano uguali gli intervalli giusti (P) più la seconda maggiore (2M). Il motivo per cui la 2M non cambia dalla Scala Maggiore Naturale alla Scala Minore Naturale sarà chiaro più avanti, per ora prendiamolo come un dato di fatto. Come chiamiamo i nuovi intervalli? Ovviamente con il numero ordinale corrispondente. E per l’attributo? Non possiamo chiamare 3M la terza della Scala Minore Naturale perché la 3M dista 2 toni dalla prima, mentre in questa Scala dista solo 1 tono e 1/2. . . regola: gli intervalli maggiori diminuiti di un semitono si chiamano minori e si indicano con « m » (minuscolo). Ora sappiamo come chiamare i nuovi intervalli; saranno: terza minore (3m), sesta minore (6m) e settima minore (7m).
38
2.2 Intervalli Vediamo, per esempio, la Scala Minore Naturale di C:
Perché abbiamo chiamato E� la terza minore del C invece di D�? Perché, come abbiamo detto in precedenza, ogni nota deve avere un nome univoco, che rispetti la posizione della nota: dunque la terza del C deve essere un E. Al «E» dovrà poi essere aggiunto il � per soddisfare la posizione in cui deve stare nella specifica scala, ad 1 tono e 1/2 dalla tonica, cioè dalla prima (1P). La stessa cosa è valida anche per il A� e per il B�. Vediamo adesso una Scala Maggiore Naturale di F�:
Ci troviamo di fronte a una particolarità (in verità, piuttosto frequente): abbiamo un E�. Sappiamo che il E� “suona” come un F e che, praticamente, per fare un E� possiamo “suonare un F” sulla tastiera dello strumento. Pertanto E� e F sono suoni omofoni. Allora perché questa complicazione? Perché chiamare E� una nota che potrebbe essere più semplicemente chiamata F? Perché la settima di un F� deve per forza chiamarsi E: se si chiamasse F sarebbe un ottava. Dunque per chiarezza armonica dobbiamo chiamarla E�. Ai fini della presente trattazione, è sufficiente dire che la scelta della scala maggiore naturale di una nota (per esempio, la scala maggiore naturale di C) per la composizione di un brano musicale, ne determina la tonalità. Un brano composto
39
2 Armonia musicale utilizzando la scala maggiore naturale di X, dove con X si intende una particolare nota (che dunque sarà la 1° della scala), si dice in tonalità maggiore di X. Data una tonalità maggiore, ciascuna nota che la compone, forma intervalli non solo con la prima, ma anche con tutte le altre note. Gli intervalli che forma con la 1, sono quelli che determinano il numero ordinale e l’attributo della nota nella tonalità. Gli ultimi tre intervalli di cui dobbiamo occuparci, e che non fanno parte né della scala maggiore naturale, né della scala minore naturale, sono gli intervalli di quarta aumentata, quinta diminuita e seconda minore. L’intervallo di quarta aumentata (simbolo: 4� o 4+ ) è definito come l’intervallo tra la 4P e la 7M di una scala maggiore naturale. Per esempio, nella scala maggiore naturale di C, l’intervallo di 4� è formato dalle note F�B; infatti F�B è sicuramente una quarta (contando da F abbiamo: F�G�A�B, quattro note) ma, essendo in T/S 3 toni, è più larga di un semitono rispetto all’intervallo di quarta giusta, che è di 2 toni e 1/2. L’intervallo di quinta diminuita (simbolo: 5� o 5− ) è invece definito come l’intervallo tra la 7M e la 4P. Nella scala di C è l’intervallo B�F, che è sicuramente una quinta (contando: B�C�D�E�F, cinque note) ma è in T/S 3 toni, dunque 1/2 tono più stretto della quinta giusta (che è 3 toni e 1/2). Notiamo che sia la 4� che la 5� sono entrambe di tre toni. Spesso sono nel loro insieme chiamati intervallo di tritono e sono molto importanti in armonia dato che (come vedremo) sono molto dissonanti e che, per ogni tonalità e quindi in ogni scala naturale, esiste solo una coppia di note che lo forma, la coppia 4P�7M (o 7M�4P). L’intervallo di tritono è l’unico ad avere questa caratteristica di unicità, all’interno di una scala: è l’unico intervallo formato da una e una sola coppia di note. L’elevata dissonanza di questo intervallo e la sua uni-
40
2.2 Intervalli vocità, gli conferiscono un estrema importanza nell’armonia musicale, infatti è ampiamente utilizzato per creare tensione armonica ad alto contenuto comunicativo. Se applicassimo l’intervallo di 4� e quello di 5� alla 1 di una scala, otterremmo due note omofone, quindi due note con nome diverso ma che corrispondono allo stesso suono. Infatti, per esempio, la 4� del C è il F� e la sua 5� è il G�, che sono evidentemente omofoni. Quando, dato un intervallo formato dalle note X � Y , si calcola l’intervallo Y � X, questa operazione è denominata rivolto. L’intervallo di tritono è l’unico ad essere uguale al suo rivolto: per tutti gli altri intervalli, il rivolto ha valore diverso. Questo conferisce ulteriore importanza all’intervallo di tritono. L’intervallo di seconda minore (2m) è invece definito come l’intervallo tra 3M�4P e 7M�8P. È l’intervallo più stretto del nostro sistema musicale, infatti corrisponde a 1/2 tono (un semitono). Essendo una seconda, è necessario che le due note che lo formano abbiano nome diverso. La 2m di un C dovrà chiamarsi D�, date le regole sopra analizzate per il calcolo degli intervalli. È anch’esso un intervallo molto dissonante, ma esistono due coppie di note in ogni scala che possono formarlo, dunque non ha le proprietà di univocità dell’intervallo di tritono. Non ci addentreremo oltre nello studio dell’armonia musicale (che è, nella sua totalità, molto più complessa) in questa trattazione, dato che le nozioni finora acquisite sono sufficienti per l’analisi dei fenomeni di consonanza e dissonanza, che è lo scopo che ci prefiggiamo. Per concludere questa sezione, ricordiamo che l’intervallo tra due note diverse con lo stesso nome è sempre un’ottava (o più ottave come vedremo tra poco), dunque le loro frequenze
41
2 Armonia musicale hanno sempre rapporto 2 (o 12 ) o potenze di 2: 2n . Per comprendere meglio questo concetto cominciamo col dire che la frequenza delle note usate viene scelta partendo da una nota la cui frequenza è stata decisa e universalmente accettata: il La, che ha (quando non altrimenti specificato) frequenza pari a 440 Hz (quindi anche 27.5, 55, 110, 220, 880, 1760, 3520 per via della definizione di intervallo di ottava). Dunque, prendendo per esempio la Scala Cromatica di C:
ma anche:
Il La a 440 Hz è sempre il La a 440 Hz. Allo stesso modo ciascuna altra nota ha una frequenza ben precisa che non varia mai1 . I 12 semitoni all’interno di una ottava sono (nel sistema musicale moderno, il cosiddetto temperamento equabile) tutti uguali, o meglio uguale per tutti i semitoni è il rapporto tra le due frequenze che lo delimitano e dunque tra le frequenze di due note successive (per esempio, tra la frequenza del Mi e quella del Fa, tra quella del Fa e√quella e quella del Fa� ecc.). Questo rapporto equivale a 12 2 o 21/12 (radice dodicesima di 2) che corrisponde a circa 1.05946309436. Quindi se il La è 440 Hz ne deriva che 1 Entro
certi limiti dipendenti dal temperamento, di cui parleremo più avanti
42
2.2 Intervalli √ il La� (o √ Si�) sarà 440 12 2 = 440 · 21/12 ≈ 466.16376, √ il Si 12 12 sarà 440 22 = 440 · 22/12 ≈ 493.8833, il Do sarà 440 23 = 440 · 23/12 ≈ 523.25113 ecc.
Il motivo della scelta di questo particolare rapporto sarà chiaro in seguito quando parleremo delle ragioni storiche per cui il nostro sistema musicale è costruito proprio in questo modo. Dato che le frequenze dei suoni musicali vanno circa da 30 Hz a 4000 Hz, ne consegue che in tutto abbiamo circa 7 ottave per un totale di 84 note. Avremo dunque 7 Do, 7 Do�, 7 Re ecc. Per distinguere queste note che, sebbene abbiano lo stesso nome, hanno frequenze diverse essendo in rapporto di una o più ottave, sono state contrassegnate col numero dell’ottava di appartenenza. La nota più bassa è il Do1 (C1 ) a 33 Hz, e quella più alta è il Si7 (B7 ) a 3951 Hz. Le note dal C4 (262 Hz) al B4 (494 Hz) sono le note della cosiddetta Ottava Centrale. Alcuni octobassi moderni (una sorta di contrabbassi alti più di 3 metri e mezzo, con tre corde, inventati da Berlioz e Vuillaume nel xix secolo) possono arrivare fino al C0 di 16.5 Hz. Non è una nota vera propria perché è al di là del campo dell’udibile umano. La si sente come vibrazione dell’aria sul corpo e si odono effettivamente solo gli armonici a partire dal secondo, che corrisponde in questo caso al C1 di 33 Hz. È utile avere a disposizione una tabella con tutte le note e le loro frequenze (in temperamento equabile) arrotondate per difetto all’unità (senza decimali).
43
2 Armonia musicale Nota C1 C�1 D�1 D1 D�1 E�1 E1 F1 F�1 G�1 G1 G�1 A�1 A1 A�1 B�1 B1 C2 C�2 D�2 D2 D�2 E�2 E2 F2 F�2 G�2 G2 G�2 A�2 A2 A�2 B�2 B2 C3 C�3 D�3 D3 D�3 E�3 E3 F3
44
ν Hz 33 35 37 39 42 44 47 49 52 55 59 62 66 70 74 78 83 88 93 98 104 110 117 124 131 139 147 156 165 175
Nota F�4 G�4 G4 G�4 A�4 A4 A�4 B�4 B4 C5 C�5 D�5 D5 D�5 E�5 E5 F5 F�5 G�5 G5 G�5 A�5 A5 A�5 B�5 B5 C6 C�6 D�6 D6 D�6 E�6 E6 F6 F�6 G�6 G6 G�6 A�6 A6 A�6 B�6 B6
ν Hz 370 392 415 440 466 494 523 554 587 622 659 698 740 784 831 880 932 988 1046 1109 1175 1245 1319 1397 1480 1568 1661 1760 1865 1976
2.2 Intervalli F�3 G�3 G3 G�3 A�3 A3 A�3 B�3 B3 C4 C�4 D�4 D4 D�4 E�4 E4 F4
185 196 208 220 233 247 262 277 294 311 330 349
C7 C�7 D�7 D7 D�7 E�7 E7 F7 F�7 G�7 G7 G�7 A�7 A7 A�7 B�7 B7 (C8 )
2093 2217 2349 2489 2637 2784 2960 3136 3322 3520 3729 3951 4186
Per completezza vediamo anche alcune note importanti sul pentagramma2 (fig. 2.1). Riassumiamo quindi gli intervalli di nostro interesse, le loro caratteristiche e i loro nomi. • Intervallo di prima giusta (o perfetta), simbolo 1P: è detto anche unisono. È l’intervallo consonante per 2 Alcuni
testi e alcuni pianoforti digitali o sintetizzatori riportano il C centrale a 262 Hz come C3 . Ma dato che la nota più grave di un comune pianoforte è il A a 27.5 Hz e che la nota più bassa raggiungibile da uno strumento è il C a 16.5 Hz (l’octobasso, a cui abbiamo accennato), in questo sistema di numerazione queste note avrebbero un indice negativo, il che non ci sembra conveniente. La nota più acuta di un pianoforte è il C8 (nel nostro sistema con C4 centrale a 262 Hz) che, a seconda del temperamento (di cui parleremo più oltre), può variare da 4186 a 4224 Hz. Nella tabella qui sopra e nella figura qui sotto, per semplicità d’esposizione tutte le frequenze (compreso il C8 ) sono indicate in temperamento equabile e approssimate all’unità.
45
2 Armonia musicale
Figura 2.1: Note importanti sul pentagramma
antonomasia essendo sostanzialmente formato da due note della stessa frequenza. È dunque definito in musica come consonanza perfetta. • Intervallo di seconda minore di un semitono (1/2 tono), simbolo 2m. In musica è definita come dissonanza forte ed è usata in quanto tensione armonica. • Intervallo di seconda maggiore di due semitoni (un tono), simbolo 2M, chiamata anche sopratonica. È anch’essa definita come dissonanza forte ed è usata come tensione armonica. • Intervallo di terza: è detto anche mediante. Può essere minore (3m, di un tono e 1/2 o tre semitoni) o maggiore (3M, di due toni, cioè quattro semitoni). La terza è di somma importanza perché determina la qualità principale (minore o maggiore) di accordi, scale e tonalità. In musica sono entrambe definite come consonanze imperfette.
46
2.2 Intervalli Intervallo
S.
T
st
CP
Unisono giusto
1P
0
0
�
Seconda minore
2m
1/2
1
Seconda maggiore
2M
1
2
Terza minore
3m
11/2
3
Terza maggiore
3M
2
4
Quarta giusta
4P
21/2
5
Quarta aumentata
4�
3
6
Quinta giusta
5P
31/2
7
Sesta minore
6m
4
8
Sesta maggiore
6M
41/2
9
Settima minore
7m
5
10
Settima maggiore
7M
51/2
11
Ottava giusta
8P
6
12
CI
d
m
f
ff
� � � � � � � � � � � �
Tabella 2.2: Intervalli (S. = sigla; T = toni; st = semitoni; consonanze: CP = perfetta, CI = imperfetta; dissonanze: d = debole, m = media, f = forte, ff = molto forte)
• Intervallo di quarta giusta o perfetta, due toni e 1/2 (cinque semitoni), 4P: è detto anche sotto–dominante. In musica è definita come consonanza perfetta e utilizzata come tale. • Intervallo di quarta aumentata o eccedente, 3 toni (sei semitoni), detta anche tritono, simbolo 4� o 4+ , si trova tra la 4P e la 5P. È la dissonanza più forte del nostro sistema musicale, al punto di essersi guadagnata il nomignolo di diabulus in musica. . . La tensione che crea questa dissonanza quando presentata in un contesto musicale è talmente importante da dover essere preparata e risolta ed è il fulcro attorno a cui si fonda il
47
2 Armonia musicale concetto di tonalità (che non esploreremo ulteriormente in questa sede per non complicare eccessivamente l’esposizione, dato che non è necessario alla trattazione dei fenomeni di consonanza e dissonanza). • Intervallo di quinta giusta o perfetta, tre toni e 1/2 (sette semitoni), simbolo 5P: è detto anche dominante. È definito e utilizzato in quanto consonanza perfetta. • Intervallo di sesta: è anche detto sopra–dominante. Può essere maggiore (6M, di quattro toni o otto semitoni) o minore (6m, di quattro toni e 1/2 quindi nove semitoni). Sono entrambe utilizzate in quanto tensioni anche se la 6m è definita come dissonanza media, non forte come la 2m o la 2M, mentre la 6M è una dissonanza debole tanto da essere spesso usata anche come consonanza. • Intervallo di settima minore, 7m, cinque toni (dieci semitoni), è detta anche sotto–tonica. È definita come dissonanza media e utilizzata come tale. • Intervallo di settima maggiore, 7M, di cinque toni e 1/2 (undici semitoni). È detta anche sensibile. È una dissonanza forte (ma non come la 4�) e utilizzata come tale in armonia. • Intervallo di ottava giusta o perfetta, 8P, sei toni (dodici semitoni). È definita come consonanza perfetta ed usata come tale. È, come abbiamo visto, la base della suddivisione in note dei suoni musicali.
48
2.3 Intervalli semplici e composti
2.3 Intervalli semplici e composti Si definisce intervallo semplice un intervallo entro l’ottava. Data la definizione di ottava, un intervallo in cui la frequenza della nota più acuta è pari al doppio della frequenza più grave (ratio = 2), e la definizione di unisono (ratio = 1), possiamo dire che un intervallo semplice è un intervallo con ratio compresa tra 1 e 2. Si definisce intervallo composto un intervallo più grande di una ottava, dunque con ratio maggiore di 2. In questa trattazione non andremo oltre le due ottave, dunque analizzeremo intervalli di ratio compresa tra 1 e 4, di cui quelli compresi tra 1 e 2 sono semplici e quelli compresi tra 2 e 4 sono composti. I numeri ordinali che definiscono gli intervalli composti continuano a partire dall’ottava e gli attributi hanno il medesimo ordine degli intervalli semplici, dato che ciascun corrispettivo composto di un intervallo semplice ha la stesse funzioni armoniche.
2.4 Rivolti Si definisce rivolto di un intervallo formato dalle note X � Y , l’intevallo Y � X. Dal punto di vista armonico, esiste una semplice regola per il calcolo del rivolto di un intervallo. Sappiamo che un intervallo è descritto da un numero ordinale e da un attributo. Il rivolto di un intervallo il cui numero ordinale è A, corrisponde a R = 9 − A. Il rivolto di una terza (ordinale A = 3) è per esempio 9 − 3 = 6, una sesta. Il rivolto di una quinta è 9 − 5 = 4 una quarta. Il rivolto di una ottava è 9 − 8 = 1 un unisono! Di fatto, calcolare il rivolto di un intervallo formato dalle note X � Y , dove X è la nota 49
2 Armonia musicale Intervallo Ottava giusta Nona minore Nona maggiore Decima minore Decima maggiore Undicesima giusta Undicesima aumentata Dodicesima giusta Tredicesima minore Tredicesima maggiore Quattordicesima minore Quattordicesima maggiore Quindicesima giusta
S. 8P 9m 9M 10m 10M 11P 11� 12P 13m 13M 14m 14M 15P
F. 8P 2m 2M 3m 3M 4P 4� 5P 6m 6M 7m 7M 8P
Tabella 2.3: Intervalli composti (S. = sigla; F. = Funzione)
più grave, equivale in sostanza ad aumentare di una ottava la nota più grave che diventerà dunque la più acuta. Dunque il rivolto di X � Y equivale (matematicamente) a Y � 2X. Se X � Y è una ottava se ne deduce che Y = 2X, quindi il suo rivolto Y � 2X sarà 2X � 2X, un unisono perfetto! Per gli attributi, il calcolo è un po’ più complesso e può essere sintetizzato nel seguente schema della tabella 2.4. Quindi, per esempio, il rivolto di una seconda maggiore (2M) sarà 9 − 2 = 7 e M→m, dunque una settima minore. Il rivolto di una quarta giusta (4P) è 9–4 = 5 e P→P quindi una quinta giusta. Il rivolto di una quinta diminuita (5�) sarà 9 − 5 = 4 e � → � e dunque una quarta aumentata. 50
2.5 Scale parallele e relative Intervallo Maggiore (M) minore (m) Giusto (P) Aumentato (�) Diminuito (�)
Rivolto minore (m) Maggiore (M) Giusto (P) Diminuito (�) Aumentato (�)
Tabella 2.4: Attributi nei rivolti
2.5 Scale parallele e relative Si definiscono scale parallele due o più scale che hanno stessa tonica ma intervalli (o note) differenti. Per esempio, la scala maggiore di C e la scala minore di C, sono scale parallele. Si definiscono scale relative due o più scale che abbiano tonica differente ma medesime note. Per esempio, la scala maggiore di C e la scala minore di A sono scale relative, infatti C�D�E�F�G�A�B�C A�B�C�D�E�F�G�A In generale possiamo dire che la scala minore naturale costruita sulla sesta maggiore di una scala maggiore naturale è chiamata relativa minore. Dunque, nell’esempio, la scala minore naturale di A (6M di C) è la relative minore della scala maggiore naturale di C. Le altre scale costruite sulle altre note di una scala di riferimento, vengono chiamate modi e indicate con un numero romano che dipende dal numero ordinale della nota su cui costruite. Per esempio, la scala D�E�F�G�A�B�C�D
51
2 Armonia musicale è detta II modo della scala maggiore naturale di C (e corrisponde in armonia alla scala dorica di D) perché è costruita a partire dalla seconda nota della scala di riferimento. Al fine dell’attuale trattazione è sufficiente sapere che il VI modo di una scala maggiore naturale è la relativa minore di quella scala e viene chiamata scala minore naturale oppure scala eolica.
2.6 Accordi a tre note (triadi) Gli accordi sono tre o più note suonate contemporaneamente. Gli accordi a tre note sono detti triadi, quelli a quattro note quadriadi e, in quelli a più di quattro, le note aggiuntive sono dette estensioni che, in base al loro utilizzo secondo le regole dell’armonia, si dividono in tensioni ed avoid notes o note da evitare. Le tensioni sono note utilizzabili per dare colore (tensione, appunto) ad un accordo, mentre le avoid notes sono note che se venissero usate creebbero effetti sgradevoli causati da intervalli altamente dissonanti (soprattutto seconde e none minori) con note della triade o della quadriade, cosa che generalmente si tende ad evitare (avoid ). Al fine di questa trattazione sarà sufficiente fermarsi alla definizione delle triadi. Sono definiti triadi gli accordi a tre note formati da intervalli di terza (maggiore o minore) e quinta (giusta, aumentata o diminuita). Vi sono quattro tipi di triadi: 1. Triade maggiore: formata da intevalli di terza maggiore e quinta giusta; chiamando 1 la nota fondamentale dell’accordo sarà 1P�3M�5P
52
2.6 Accordi a tre note (triadi) 2. Triade minore: formata da intervalli di terza minore e quinta giusta, quindi 1P�3m�5P 3. Triade aumentata: formata da terza maggiore e quinta aumentata (che in temperamento equabile è omofona della sesta minore): 1P�3M�5� 4. Triade diminuita: formata da terza minore e quinta diminuita (omofona della quarta aumentata) 1P�3m�5� Ovviamente le triadi non rappresentano tutte le possibilità di combinazione tra intervalli ma solo quelle di pertinenza armonica con un preciso significato comunicativo all’interno del sistema musicale. Nonostante l’improprietà di linguaggio musicale, chiameremo dunque terne tutte le altre possibili combinazioni. Per esempio, 1P�2M�7M è una terna mentre 1P�3M�5P è una triade maggiore. Quindi le triadi sono un sottoinsieme, armonicamente rilevante, delle terne, infatti sono terne formate da note in rapporto di 3M e 5P con la fondamentale dell’accordo (la 1P). Le triadi possono essere in tre posizioni, a seconda della nota più grave (nota al basso). 1. Posizione fondamentale: la nota più grave è la 1P 2. Primo rivolto: la nota più grave è la 3M 3. Secondo rivolto: la nota più grave è la 5P Ciascuna di queste posizioni può trovarsi a rapporti stretti o a rapporti lati. Per esempio, la triade 1P�3M�5P è in posizione fondamentale a rapporti stretti mentre la triade 1P�5P�10M è in posizione fondamentale a rapporti lati; quella che cambia dunque in questo caso è la nota più acuta (nota al canto).
53
2 Armonia musicale Per il momento non ci soffermeremo ulteriormente su questo concetto. Sono definite invece quadriadi, le triadi con l’aggiunta di un intervallo di settima (maggiore, minore o diminuita).
2.7 La notazione musicale La notazione in lettere (o sigle) è stata la prima, storicamente, ad essere adottata. I primi furono gli antichi greci che usavano le prime lettere dell’alfabeto greco e furono seguiti dai romani i quali, imitandoli, utilizzarono il loro alfabeto (che è poi anche il nostro). Fu il monaco benedettino Guido D’Arezzo, che nella prima metà dell’anno 1000, rivoluzionò la notazione musicale, introducendo il pentagramma (che al tempo era in realtà un tetragramma, formato da soli 4 righi) e cambiò il nome delle note utilizzando le prime sillabe delle sette strofe di un antico inno latino a S. Giovanni Battista, le cui note corrispondenti erano proprio le 7 note che conosciamo, quelle della Scala Maggiore di C: Ut queant laxis / Resonare fibris / Mira gestorum / Famuli tuorum / Solve polluti / Labii reatum / Sancte Iohannes. Di fatto, il «Do» si chiamava al tempo «Ut» e il «Si» venne ancora per molto tempo chiamato «B», come nell’antica Roma. In Francia, ancora oggi, il «Do» viene chiamato «Ut» Nella prima metà del 1600, il teorico musicale G. B. Doni utilizzò la prima sillaba del suo nome per chiamare «Do» anziché «Ut» la prima nota della serie. In seguito anche la nota «B» venne cambiata in «Si», probabilmente tenendo conto delle iniziali di Sancte Iohannes, l’ultima strofa dell’antico inno latino usato più di seicento anni prima da Guido D’Arezzo,
54
2.7 La notazione musicale anche se in quella strofa nemmeno una nota corrisponde alla nota «Si» (la melodia dell’inno va dal Do al La). Può essere utile sapere, riguardo il nome delle note che, in Germania e Russia, il «Si naturale» viene chiamato «H», mentre «B» è il «Si bemolle». J.S. Bach, inserì il suo nome in note come firma in alcune composizioni, utilizzando appunto Si bemolle, La, Do e Si naturale. . . B A C H. Per esempio lo usò come tema nel controsoggeto della fuga finale (Contrapunctus XIV ) della sua Arte della fuga (battute da 235 a 237), rimasta purtroppo incompleta alla sua morte nel 1750. Lo aveva già usato come firma musicale in altre composizioni: alla fine della quinta delle Variazioni canoniche sul corale Vom Himmel hoch, da komm ich her (BWV 769) e nella sezione della Passione secondo Matteo (BWV 244), in cui il coro canta «Veramente quest’uomo era il Figlio di Dio». Altri compositori dopo di lui utilizzarono il suo nome in note come tributo oppure il proprio come, per esempio, il compositore ungherese Béla Bartòk che usò le note B E B A oppure B A B E quali iniziali del suo nome. Inoltre nella notazione tedesca i diesis e i bemolli venivano segnati apponendo rispettivamente il suffisso –is o –es alla lettera corrispondente, il che portò altri compositori a comporre i loro nomi in note. In questa trattazione utilizzeremo la notazione in sigle moderna, ormai accettata come internazionale, dunque, rivedendola useremo le seguenti sigle: Do ⇒ C Re ⇒ D Mi ⇒ E Fa ⇒ F Sol ⇒ G La ⇒ A Si ⇒ B 55
2 Armonia musicale
2.8 Altri sistemi musicali Come accennato precedentemente, ogni popolo ha sviluppato un proprio sistema musicale, appronfondendo aspetti anche molto differenti del materiale sonoro. Ciononostante, si può affermare che gli intervalli di ottava e di quinta giusta (8P e 5P) sono una costante, presente in tutte le culture musicali. Come vedremo infatti, le frequenze che formano questi intervalli, godono di particolari proprietà fisiche e matematiche che le rendono particolarmente speciali ed è dunque lecito supporre che, a prescindere dallo specifico aspetto musicale che ciascun popolo ha indagato e utilizzato a scopi artistici, gli intervalli di ottava e di quinta giusta siano la base delle strutture armoniche dell’arte musicale.
56
3 La Scala di Giusta Intonazione el sistema musicale di cui abbiamo parlato nel capitolo N precedente, tutti i semitoni sono uguali: il rapporto tra la frequenza di una nota e quella immediatamente successiva
√ è uguale per tutte le note, ed è pari a 12 2. Questo è il sistema utilizzato oggi, che è però una notevole semplificazione del sistema di Giusta Intonazione in cui i rapporti tra le note pur essendo meno complessi, e quindi descrivibili da rapporti frazionari semplici, non sono tutti uguali. Nonostante le complicazioni di ordine tecnico, soprattutto nella costruzione degli strumenti musicali e nel passaggio da una tonalità ad un’altra (modulazione) della Scala di Giusta Intonazione (sgi), questa rimane effettivamente la base dell’armonia occidentale. Qualunque sistema d’intonazione si discosti dalla Giusta Intonazione è chiamato Temperamento. Nella storia si sono avvicendati numerosi temperamenti allo scopo di aggirare le difficoltà tecniche e costruttive dovute all’imparità dei rapporti della scala di giusta intonazione (sgi). Quello che utilizziamo oggi e che si è rivelato il più comodo (anche se non il migliore dal punto di vista musicale) è chiamato sistema a Temperamento Equabile (ste) e pressuppone appunto che tutti i semitoni siano uguali e pari al rapporto che abbiamo menzionato. In realtà, lo studio matematico dei rapporti musicali ha radici fin nell’antichità. Pitagora per primo, nel
57
3 La Scala di Giusta Intonazione vi secolo a.C., tentò di trovare una soluzione per arrivare a definire i rapporti musicali e dunque spiegare matematicamente la musica, ma sarà solo con le Istitutioni Harmoniche di Gioseffo Zarlino, nel 1558, che si arriverà alla formulazione della cosiddetta Scala di Giusta Intonazione, che definisce i rapporti esatti tra ciascuna nota. Questi rapporti, scopriremo, sono effettivamente legati a speciali proprietà fisiche e matematiche delle onde sonore. Dobbiamo dunque ora comprendere come siamo arrivati a suddividere l’ottava nei dodici semitoni che conosciamo, addentrandoci nel Sistema a Giusta Intonazione (sgi). Nuovamente, entrano in gioco gli armonici e in particolare i reciproci rapporti tra i primi 6 armonici di un suono. Prima di iniziare è importante sottolineare nuovamente il concetto di ottava. Dato un suono di frequenza ν1 , un suono ν2 è entro l’ottava se ν1 ≤ ν2 ≤ 2ν1 , pertanto per essere compreso in una ottava un intervallo ν2 /ν1 deve essere compreso tra 1 e 2. Per riportare in ottava un intervallo che la eccede sarà sufficiente (data la definizione di ottava) dividerlo per 2n , dove n è il numero di ottave di cui eccede. Un intervallo che invece sia minore di una ottava, andrà moltiplicato per 2n (2 elevato al numero n di ottave). Prendiamo un esempio: il rapporto 75/11 eccede ovviamente l’ottava. Sapere di quante ottave eccede, equivale a sapere qual’è la potenza n a cui devo elevare 2 tale per cui 1 ≤ 2n (75/11) ≤ 2; dunque se calcoliamo che 75/11 = 6.81, il logaritmo in base 2 di questo numero darà come risultato la potenza a cui devo elevare 2 per ottenere 6.81. Se quindi ora arrontiamo per difetto questo risultato e ne cambiamo il segno, avremo trovato la potenza che ci serve; oppure, più semplicemente, possiamo arrontondare per eccesso (simbolo �x�, dove x rappresenta l’argomento da ar58
rontondare) il risultato del logaritmo in base 2 di 11/75. In generale dunque, dato un rapporto N/M , per riportarlo in ottava (se necessario) basterà moltiplicarlo per 2n dove n è � �� � M n = log2 N quindi
N · 2�log2 (M/N )� ≤ 2 M Torniamo dunque alla Scala di Giusta Intonazione (sgi). Abbiamo già visto che il rapporto tra il primo e il secondo armonico (o meglio, tra il II e il I, cioè 2ν/ν = 2) definisce l’intervallo di ottava, che può essere espresso dal numero puro 2, come ratio tra le due frequenze. Il rapporto tra il terzo e il secondo armonico è invece 3ν/2ν = 3/2 e definisce quello che viene chiamato intervallo di quinta giusta: un suono che abbia frequenza pari a 3 2 ν è la quinta giusta del suono con frequenza ν. Il rapporto tra il quarto e il terzo armonico è 4ν/3ν = 4/3 e definisce l’intervallo di quarta giusta. Il rapporto tra il quinto e il quarto armonico è 5ν/4ν = 5/4 e definisce l’intervallo di terza maggiore. Il rapporto tra il sesto e il quinto armonico è 6ν/5ν = 6/5 e definisce l’intervallo di terza minore. Pertanto, chiamando C (Do) il suono di frequenza ν e applicando le frazioni ottenute dal rapporto tra i primi sei armonici avremo i suoni in tabella 3.1. Abbiamo dunque 4 intervalli definiti giusti che sono detti anche consonanze perfette: quarta giusta o perfetta (4P), quinta giusta o perfetta (5P), unisono perfetto (1P o semplicemente 1) e ottava perfetta (8P o semplicemente 8); e 2 intervalli definiti maggiore e minore che sono detti anche consonanze imperfette: la terza maggiore (3M) e la 1≤
59
Nota
ν
C
Intervallo Unisono giusto
6 5ν
E�
Terza minore
3m
�
5 4ν
E
Terza maggiore
3M
�
4 3ν
F
Quarta giusta
4P
�
�
3 2ν
G
Quinta giusta
5P
�
�
2ν
C
Ottava giusta
8P
Sigla
Freq
3 La Scala di Giusta Intonazione
1P
G.P. �
C.P. �
C.I.
�
Tabella 3.1: Consonanze di Giusta Intonazione (G.P. = gradi principali; C.P. = consonanze perfette; C.I. = Consonanze Imperfette)
terza minore (3m). La prima, la quarta e la quinta sono chiamati anche gradi principali, e una successione di note 1P�3M�5P (ν, 54 ν, 32 ν) è detta triade maggiore, mentre 1P�3m�5P (ν, 65 ν, 32 ν) è detta triade minore. I tre gradi principali e le due triadi possono essere considerati l’essenza della costruzione armonica. Infatti, applicando la triade maggiore a tutti i 3 gradi principali otteniamo la cosiddetta scala maggiore di giusta intonazione (o scala di Zarlino). Per l’unisono sappiamo già che la 3M ha frequenza 54 ν e la 5P ha frequenza 32 ν. Vediamo che frequenza hanno (sempre in funzione di ν) la 3M e la 5P della quarta giusta di ν che ha frequenza 43 ν: • la 3M di 43 ν sarà 54 43 ν = 53 ν e questo intervallo sarà chiamato di sesta maggiore (6M); • la 5P di 43 ν sarà
60
3 4 2 3ν
= 2ν che sappiamo essere l’ottava.
Ora applichiamo la triade maggiore anche all’ultimo grado principale, la quinta giusta che ha frequenza 32 ν: • la 3M di 32 ν sarà 54 32 ν = 15 8 ν, e questo intervallo sarà chiamato di settima maggiore (7M); • la 5P di 32 ν sarà invece 32 32 ν = 94 ν che supera l’ottava (perché è maggiore di 2); utilizzando la formula data in precedenza otterremo 94 ν · 2�log2 (4/9)� = 98 ν e questo intervallo sarà chiamato di seconda maggiore (2M). Abbiamo ora tutte le 7 note della scala maggiore di giusta intonazione (vedi tabella 3.2). Freq ν
Nota C
Intervallo 1P
Costruzione
9 8ν
D
2M
5P della 5P
5 4ν
E
3M
4 3ν
F
4P
3 2ν
G
5P
5 3ν
A
6M
3M della 4P
15 8 ν
B
7M
3M della 5P
2ν
C
8P
Tabella 3.2: Scala maggiore di Giusta Intonazione
Ecco spiegato il motivo per cui solo 7 note in una ottava hanno un nome: sono le 7 note della scala maggiore di giusta
61
3 La Scala di Giusta Intonazione intonazione di C, che sono il risultato dell’applicazione della triade maggiore ai tre gradi principali. Facendo i calcoli noterete che il rapporto F/E = 43 ÷ 54 = 16 15 e il rapporto 16 C/B = 2 ÷ 15 8 = 15 sono uguali e molto più piccoli degli altri: ecco perché tra E e F, e tra B e C c’è solo un semitono. Applicando invece la triade minore (1P�3m�5P) ai tre gradi principali otterremo la scala minore di giusta intonazione. Sappiamo già che la 3m di ν è 65 ν e la 5P già la conosciamo 3 2 ν. Applichiamo la triade minore alla quarta giusta: • sappiamo già che la sua 5P corrisponde all’ottava; • la sua 3m corrisponde a sesta minore (6m).
6 4 5 3ν
=
8 5ν
e sarà chiamata
Applicandola invece alla quinta giusta: • sappiamo già che la sua 5P corrisponde a 98 ν ed è la seconda maggiore della tonalità (ecco perché dalla scala maggiore a quella minore la seconda non cambia: è sempre costruita in quanto 5P della quinta giusta); • dobbiamo invece calcolare la sua 3m che sarà e sarà chiamata settima minore (7m).
6 3 5 2ν
= 95 ν
Ecco dunque la scala minore di giusta intonazione (tabella 3.3). Se ora osseriviamo meglio tutte le note calcolate (perfette, maggiori e minori) vedremo però che ce ne “mancano” due. . . Il F� e il D�.
62
Freq ν
Nota C
Intervallo 1P
Costruzione
9 8ν
D
2M
5P della 5P
6 5ν
E�
3M
4 3ν
F
4P
3 2ν
G
5P
8 5ν
A�
6M
3m della 4P
9 5ν
B�
7M
3m della 5P
2ν
C
8P
Tabella 3.3: Scala minore di Giusta Intonazione
C�F� è definito come intervallo di quarta aumentata (4�) mentre C�D� come seconda minore (2m). L’intervallo di quarta aumentata1 (4�) è definito come: • il rapporto che c’è tra la 4P e la 7M: • oppure come 5P della 7M ottava è ancora 45 32
3 15 2 8
=
45 16
15 8
÷
4 3
=
45 32
che riportato in
1 La
ratio che definisce la 4� è definita diversamente in diversi libri e sistemi di analisi. Ci riferiamo qui al rapporto 45/32 perché è il rapporto matematico corretto, date le sue definizioni. Vista la sua importanza, riprenderemo più avanti la sua analisi nel corso di questa trattazione
63
3 La Scala di Giusta Intonazione C
1P
ν
D�
2m
16 15 ν
D
2M
9 8ν
E�
3m
6 5ν
E
3M
5 4ν
F
4P
4 3ν
F�
4�
45 32 ν
G
5P
3 2ν
A�
6m
8 5ν
A
6M
5 3ν
B�
7m
9 5ν
B
7M
15 8 ν
C
8P
2ν
Tabella 3.4: Scala cromatica di giusta intonazione
• oppure come semitono cromatico (che, come vedremo 135 4 nel Capitolo 6, è definito quale 135 128 ) dalla 4P: 128 3 = 45 32
Dunque la 4� è 45 32 . L’intervallo di seconda minore (2m) è invece è definito come • rapporto tra la 7M e la 8P: 2 ÷ 64
15 8
=
16 15
• come quinta diminuita2 della 5P e sarà ugualmente 64 3 32 16 45 2 = 15 che riportato in ottava è sempre 15 • oppure come 4P della della 6m: in ottava è 16 15
4 8 3 5
=
32 15
che riportato
• o anche come semitono diatonico dalla 1P che, come vedremo nel Capitolo 6, è proprio 16 15 Quindi la 2m è 16 15 . Ora abbiamo tutta la scala cromatica al completo (tabella 3.4) e quindi tutte le dodici note comprese in un intervallo di ottava. Facendo i calcoli, noteremmo di fatto, che i semitoni della scala di giusta intonazione non sono tutti uguali. Approfondiremo questa dissimmetria sotto diversi punti di vista. Ricordiamo ora, che alcuni degli intervalli che formano la scala di giusta intonazione, sono stati derivati dal rapporto tra i primi 6 armonici consecutivi: la 3m, la 3M, la 4P, la 5P e la stessa 8P. In generale, invertendo il punto di vista, possiamo dire che ogni intervallo di tipo frazionario N/M , può essere visto anche come rapporto fra l’N esimo e l’M esimo armonico di una qualunque frequenza, e dunque tra gli armonici N ν e M ν di una frequenza ν. Quindi, per esempio, la 2m di 16 15 può essere vista come il rapporto tra il 16° e il 15° armonico di una frequenza ν, infatti 16ν/15ν = 16 15 . Ma non solo. Data la definizione di ottava, un rapporto pari a 2n , è possibile dire che qualunque rapporto N/2n sia pari all’armonico N , n ottave più grave. Per esempio, la 2M di 98 2 Ci
occuperemo più oltre dell’intervallo di 5�, che comunque è definito come rivolto della 4� ovvero come il rapporto tra la 4� e la 8P, dunque 2 ÷ 45 = 64 oppure come rapporto tra la 7M e la 4P 43 ÷ 15 = 32 32 45 8 45 che riportato in ottava è 64 45
65
3 La Scala di Giusta Intonazione (quindi 9/23 ) può essere vista sia come il rapporto tra il 9° e l’8° armonico, sia come il 9° armonico di una frequenza ν, 3 ottave sotto. Questo significa che, un qualunque suono complesso contiene già nei suoi armonici alcuni degli intervalli che, riportati in ottava, formano buona parte della scala di giusta intonazione. In particolare, dato un suono di frequenza ν, i suoi armonici sono: 2ν
l’ottava (8P)
3ν
riportato in ottava è 32 , la 5P
4ν
è ancora una ottava (22 )
5ν
in ottava è 5/22 = 54 , la 3M
6ν
in ottava è 6/22 = 32 , di nuovo una 5P
7ν
in ottava è 74 , non utilizzato in giusta intonazione, simile ad una 7m
8ν
è un’ottava (23 )
9ν
in ottava è 9/23 = 98 , la 2M
10ν
in ottava è
11ν
in ottava è 11 8 , non utilizzato in giusta intonazione, simile ad una 4�
12ν
in ottava è
13ν
in ottava è 13 8 , non utilizzato in giusta intonazione, simile ad una 6m
66
10 8
12 8
= 54 , di nuovo la 3M
= 32 , ancora la 5P
14ν
in ottava è
14 8
15ν
in ottava è
15 8 ,
16ν
in ottava è la fondamentale (24 )
=
7 4
la 7M
ecc. Quindi un suono complesso nei suoi armonici già contiene l’ottava, la terza maggiore, la quinta giusta, la seconda maggiore e la settima maggiore (molto lontana, è il 15° armonico). Entro i primi 6 armonici, vediamo comunque contenute le basi della consonanza del sistema musicale europeo: 1P�3M�5P, chiamata Triade Maggiore e definita infatti in musica come l’accordo a tre note più consonante. È utile vedere su un pentagramma la reale estensione degli armonici di un suono (figura 3.1). Scegliamo il C2 come fondamentale.
Figura 3.1: Armonici di un suono
Tra parentesi abbiamo segnato gli armonici non corrispondenti esattamente alle note utilizzate nel sistema a giusta
67
3 La Scala di Giusta Intonazione intonazione. I primi sedici armonici dunque sono entro 4 ottave dalla fondamentale. Notiamo che all’aumentare della frequenza aumenta anche la densità di note nell’ottava: la prima ottava da C2 a C3 è “vuota”, delimitata solamente dalla 1P e dalla 8P; la seconda ottava, da C3 a C4 , contiene solo il III armonico, la 5P; la terza ottava, C4 C5 , contiene V, VI e VII armonico; la quarta ottava, da C5 a C6 , contiene invece IX, X, XI, XII, XII, XIV e XV armonico. Il motivo di questa distribuzione risiede nella natura logaritmica (non lineare) della nostra percezione del pitch, cioè della altezza dei suoni. Riprenderemo più volte, sotto differenti punti di vista, questa caratteristica nel corso della trattazione.
68
4 Principi di anatomia e neurofisiologia
I
n questo capitolo1 affronteremo succintamente la descrizione dell’anatomia dell’apparato uditivo, concentrandoci maggiormente sulla parte più interna (la coclea e le sue strutture) che è la sede della trasduzione degli stimoli sonori in impulsi nervosi diretti alla corteccia uditiva. Integreremo le conoscenze anatomiche acquisite con concetti di neurofisiologia e psicoacustica per meglio comprendere i meccanismi alla base della percezione del suono. La funzione dell’apparato uditivo è quella di convertire l’energia sonora in impulsi nervosi. Il suono è causato come sappiamo da onde di compressione che si propagano nell’aria. L’emittente del suono crea onde comprimendo e decomprimendo alternativamente l’aria. Quando le onde sonore colpiscono la membrana del timpano, la compressione e la decompressione alterne dell’aria adiacente alla membrana, fanno sì che quest’ultima si muova in senso alternato. Il centro della membrana del timpano è connesso al manico del martello; questo a sua volta è connesso all’incudine, e l’incudine alla staffa. Il movimento del manico del martello pertanto fa sì che anche la staffa si muova nello stesso senso contro la 1A
cura di Massimo Pierini e Laurent Mapelli
69
4 Principi di anatomia e neurofisiologia finestra ovale della coclea, trasmettendo in tal modo l’onda sonora al liquido cocleare.
Figura 4.1: Apparato uditivo
4.1 Costituzione dell’orecchio L’orecchio si può dividere in tre parti: esterna, media e interna. Ciascuna di queste parti contribuisce in modo differente alla trasmissione dell’onda sonora all’organo di trasduzione
70
4.2 Orecchio esterno del segnale detto organo del Corti. L’orecchio esterno è composto da: padiglione auricolare, struttura cartilaginea ricoperta dalla cute, che raccoglie i suoni esterni; condotto uditivo esterno, convoglia i suoni verso l’orecchio medio; membrana del timpano, vibra a causa dell’onda sonora e trasmette la vibrazione alle strutture dell’orecchio medio. L’orecchio medio è costituito da: cavo del timpano; tuba uditiva; ossicini (incudine, martello e staffa), ricevono la vibrazione della membrana del timpano e la trasmettono all’orecchio interno. L’orecchio interno consiste in: labirinto osseo, contiene il labirinto membranoso; labirinto membranoso, contiene le strutture deputate alla trasduzione dei segnali acustici e statocinetici; meato acustico interno.
4.2 Orecchio esterno Il padiglione auricolare (figura 4.2) è di forma concava verso l’esterno, allungata supero-inferiormente e terminante nella parte inferiore con il lobulo (o lobo) dell’orecchio. La parte concava non è liscia ma presenta una serie di rilievi che dall’esterno verso l’interno prendono il nome di: elice (helix ), termina col tubercolo di Darwin, si continua nel tratto superiore (o curvilineo) del padiglione; fossa scafoidea (scapha) e fossa triangolare (fossa triangularis), comprese tra l’elice e l’antelice; antelice (anti-helix ), delimita il contorno della conca auricolare; conca auricolare (concha), compresa tra antelice, trago e antitrago, continua direttamente nel meato acustico esterno; trago (tragus) e antitrago (anti-tragus), due rilievi che delimitano la conca auricolare, anteriormente e posteriormente.
71
4 Principi di anatomia e neurofisiologia
Figura 4.2: Padiglione auricolare
La porzione iniziale del condotto uditivo esterno (figura 4.1), o meato acustico esterno, è costituita esternamente da un prolungamento della cartilagine del padiglione e internamente è compresa nella rocca petrosa dell’osso temporale; tale prolungamento ha la forma di una doccia, chiusa postero-superiormente da una lamina connettivale. Il condotto è rivestito da epidermide al di sotto della quale sono localizzate ghiandole sebacee e speciali ghiandole sudoripare chiamate ceruminose, il cui secreto costituisce il cerume che contribuisce a protteggere il meato acustico esterno rivestendolo. Il fondo del meato acustico è rappresentato dalla membrana del timpano (fig. 4.3) disposta obliquamente. La membrana del timpano è rivestita esternamente da cute ed internamente da mucosa.
72
4.3 Orecchio medio
Figura 4.3: Timpano
4.3 Orecchio medio Rappresenta la parte mediana dell’organo dell’udito. È compreso tra l’orecchio esterno e l’interno. Rappresenta una camera che si frappone fra l’esterno e l’interno, scavata nella rocca petrosa dell’osso temporale. È costituito da: cavo del timpano (o cassa del timpano) è una cavità ossea piuttosto ristretta, delimitata esteriormente dalla membrana del timpano e contenente la catena degli ossicini. Nella parete mediale vi sono due orifizii che portano all’orecchio interno: la finestra del vestibolo o finestra ovale che comunica con la scala vestibolare della coclea e su cui si affaccia la staffa della catena degli ossicini; e la finestra della chiocciola o finestra rotonda che comunica con la parte terminale della scala timpanica della coclea. Ventralmente il cavo del timpano continua nella tuba uditiva (ostio timpanico), la quale decorre obliquamente ed in basso e sbocca nella faringe, al davanti della sua parete posteriore (ostio faringeo). Indietro e in alto comunica con l’antro
73
4 Principi di anatomia e neurofisiologia
Figura 4.4: Orecchio medio
mastoideo, uno spazio sferoidale nel quale sboccano numerose cavità più piccole, le cellule mastoidee. Questo complesso di cavità, contenenti aria e rivestite da mucosa, riempie interamente la mastoide e può estendersi nella rocca petrosa. La tuba uditiva (dell’Eustachio) è rivestita da un epitelio ciliato ed è formata da una porzione ossea e da una porzione cartilaginea, separate dall’istmo della tuba. Il muscolo tensore del timpano si inserisce sulla parete della porzione cartilaginea e decorre verso il cavo timpanico, separato dal lume della tuba per mezzo di una lamella ossea. Il cavo del timpano comunica, mediante la tuba con la cavità faringea cosicché sono resi possibili il ricambio e l’equilibrio
74
4.3 Orecchio medio della pressione dell’aria nell’orecchio medio. Normalmente l’ostio faringeo della tuba è a forma di fessura e risulta chiuso; si apre soltanto durante la contrazione dei muscoli faringei (deglutizione). Gli ossicini formano con la membrana del timpano il sistema della trasmissione acustica. In ordine dall’esterno verso l’interno sono il martello (malleus), l’incudine (incus) e la staffa (stapes).
Figura 4.5: Martello
Inferiormente, il manico del martello (manubrium) è fissato alla membrana del timpano e superiormente, nella testa del martello (head ), possiede una faccia articolare a forma di sella per il corpo dell’incudine. L’incudine si articola con il martello superiormente e con la staffa inferiormente, tramite il processo lungo (long crus) che termina nel processo lenticolare (lenticular process) il quale si articola con la testa della staffa (head ). La base della staffa corrisponde alla finestra ovale (finestra del vestibolo, vestibular fenestra) ed aderisce al suo contorno mediante il legamento anulare della staffa. Alcuni legamenti
75
4 Principi di anatomia e neurofisiologia
Figura 4.6: Incudine
collegano gli ossicini con la parete della cavità del timpano mantenendoli nella loro posizione. La funzione dell’orecchio medio è quello di trasmettere efficaciemente l’onda sonora all’orecchio interno. Se non esistesse e i suoni raggiungessero direttamente la finestra ovale della coclea, essendo riempita di liquidi, la maggior parte dell’energia verrebbe riflessa in quanto i liquidi hanno un impedenza acustica maggiore dell’aria. Inoltre, per frequenze intorno a 1 kHz, la catena degli ossicini funziona come una leva che aumenta la pressione sulla finestra ovale. Infatti l’udito umano è particolarmente sensibile per frequenze comprese tra 1 kHz e 3 kHz, intervallo nel quale sono compresi la maggior parte degli armonici prodotti dalla voce umana. Sono verosimilmente anche disposti in modo da ridurre l’inerzia che può derivare dai movimenti del capo.
76
4.4 Orecchio interno
Figura 4.7: Staffa
4.4 Orecchio interno È la parte finale dell’organo dell’udito. È l’elemento organizzatore e recettore dei suoni ed è situato nella rocca petrosa dell’osso temporale. È costituito da: labirinto osseo, che contiene il labirinto membranoso; labirinto membranoso; vestibolo: sacculo e utricolo; canali semicircolari; coclea; nervo vestibolare; nervo cocleare. Il labirinto membranoso è un sistema di vescicole e canali circondato completamente da una capsula ossea molto dura. Si parla così di un labirinto osseo e di uno membranoso. Tra la superficie interna del labirinto osseo e le formazioni molli del labirinto membranoso, si trova la perilinfa, mentre il labirinto membranoso contiene l’endolinfa, un liquido vischioso. La finestra ovale, chiusa dalla staffa, conduce al vestibolo che rappresenta la parte media del labirinto osseo. In avanti il vestibolo continua nella chiocciola ossea, mentre nella sua faccia posteriore sboccano i canali semicircolari. Il vestibolo contiene due vescicole membranose dette anche
77
4 Principi di anatomia e neurofisiologia
Figura 4.8: Labirinto osseo
organi otolitici ovvero il sacculo (saccule) e l’utricolo (utricle), e i canali semicircolari (semicircular canals). Il sacculo e l’utricolo presentano, in una posizione circoscritta della parete, un epitelio sensoriale, la macula del sacculo e la macula dell’utricolo, e sono collegate l’una all’altra attraverso il canale utricolosacculare, dal quale si diparte il sottile dotto endolinfatico (ductus endolymphaticus), che raggiunge la faccia posteriore della rocca petrosa e termina a fondo cieco sotto la dura madre con una vescicola appiattita, il sacco endolinfatico. Il dotto reuniente (canalis reuniens) collega il sacculo con la chiocciola membranosa (ductus cochlearis). I canali semicircolari sono formati da tre canali ossei a forma di semicerchio; provengono dal vestibolo e contengono i canali membranosi, detti dotti semicircolari (semicircular ducts), che sono collegati con l’utricolo; essi sono circondati da perilinfa e fissati alle pareti ossee da sottili tralci connettivali. I tre dotti sono disposti perpendicolarmente l’uno rispetto all’altro:
78
4.4 Orecchio interno
Figura 4.9: Labirinto osseo e membranoso
• il dotto semicircolare superiore è diretto con la sua convessità contro la parete della piramide • il dotto semicircolare posteriore è parallelo alla superficie posteriore della rocca petrosa • il dotto semicircolare laterale giace sul piano orizzontale. Ogni dotto presenta in corrispondenza dello sbocco nell’utricolo una dilatazione, ampolla membranosa, alla quale corrisponde un’ampolla ossea. Il dotto superiore e quello posteriore si uniscono, in parte, formando un braccio comune. Ogni ampolla contiene epitelio sensoriale, la cresta ampollare. I tre canali semicircolari sono tra loro perpendicolari e orientati lungo i tre assi spaziali; le cellule recettrici di queste strutture, situate nelle ampolle membranose, rispondono all’accelerazione e alle variazioni di accelerazione angolare del capo. Infatti quando il capo ruota, la forza sviluppata dall’inerzia del liquido dei canali semicircolari preme contro una massa gelatinosa detta cupola, posta all’interno dell’ampolla, che provoca lo spostamento delle ciglia delle cellule recettrici
79
4 Principi di anatomia e neurofisiologia dell’epitelio vestibolare, le quali evocano un potenziale che viene trasmesso alle terminazioni nervose del nervo ampollare. Gli organi otolici invece (sacculo e utricolo), rilevano le accelerazione lineari durante il movimento e la posizione del capo rispetto alla forza di gravità. Infatti, anche le macule sono provviste di una sostanza gelatinosa che però contiene anche cristalli di carbonato di calcio (detti otoliti). La macula dell’utricolo è posta sul piano orizzontale quando il capo è eretto; quando viene piegato, la sostanza gelatinosa e gli otoliti sono sottoposti ad accelerazione lineare, che piega le ciglia dell’epitelio sensoriale il quale risponde con la generazione di un potenziale elettrico. La macula del sacculo, invece, è orientata in senso verticale, dunque risponde ad accelerazioni lineari del capo in questa specifica direzione. Entrambe le macule sono raggiunte dai rami periferici dei neuroni del ganglio vestibolare, ai quali giungono gli impulsi diretti alle strutture più interne del sistema nervoso. La chiocciola ossea si avvolge attorno ad un asse conico, il modiolo, che contiene i gruppi cellulari del ganglio spirale, i fasci di fibre nervose che provengono dalle cellule gangliari e, nella parte mediana, la radice cocleare. Una lamina ossea, lamina spirale ossea, contiene fibre nervose che si portano all’Organo del Corti. Il canale spirale della chiocciola, contiene il condotto cocleare (membranoso). La coclea è una struttura membranosa, costituita da tubicini avvolti a spirale. È composta da tre distinti condotti posti l’uno a contatto dell’altro, chiamati rispettivamente scala vestibolare (scala vestibuli ), scala timpanica (scala tympani ) e scala media o dotto cocleare (ductus cochlearis). La scala vestibolare inizia dalla finestra ovale e si conclude nell’elicotrema, al centro della spirale. La scala timpanica inizia invece dall’elicotrema e si conclude nella finestra rotonda. Dunque
80
4.4 Orecchio interno
Figura 4.10: Sezione della coclea
le due scale comunicano attraverso il foro dell’elicotrema, al centro della spirale. Questi condotti sono pieni di liquido, e sono separati l’uno dall’altro da membrane. La membrana tra la scala vestibolare e la scala media (detta membrana vestibolare o membrana di Reissner) è così sottile da non costituire per nulla un ostacolo al passaggio delle onde sonore. La sua funzione è solo quella di separare il liquido della scala media da quello della scala vestibolare. I due liquidi hanno origine diversa e le differenze chimiche esistenti fra loro sono importanti per l’appropriato funzionamento delle cellule recettrici. Invece la membrana che separa la scala media da quella timpanica, chiamata membrana basilare è una struttura molto robusta, che costituisce un effettivo ostacolo per le onde di pressione causate dal suono. La sua base è posta verso l’esterno della spirale in prossimità della finestra ovale, metre il suo apice è posto all’interno in prossimità del centro
81
4 Principi di anatomia e neurofisiologia della spirale, chiamato «elicotrema». Essa è costituita da fibre a forma di bacchetta, rigide e sottili, che penetrano nella membrana da un lato. Queste fibre, chiamate fibre basilari, sporgono per la maggior parte della loro estensione attraverso la membrana. Poste sulla superficie della membrana basilare vi sono le cellule recettrici chiamate cellule ciliate dell’organo del Corti. Al di sopra delle cellule ciliate dell’organo del Corti, dunque entro la scala media (ductus cochlearis), poggia la membrana tectoria.
Figura 4.11: Organo del Corti
Quando una vibrazione sonora raggiunge la coclea, la finestra ovale dapprima si muove verso l’interno, premendo contro il liquido della scala vestibolare. L’improvviso aumento
82
4.4 Orecchio interno di pressione nella scala vestibolare fa protudere la membrana basilare verso la scala timpanica; il liquido di quest’ultimo viene di conseguenza spinto verso la finestra rotonda che protrude verso l’esterno a causa della pressione. Il movimento inverso della staffa inverte i fenomeni: diminuisce la pressione del liquido che si muove in direzione opposta e dunque la membrana basilare si sposta verso la scala vestibolare. Ad ogni movimento della membrana basilare, la membrana tectoria piega le ciglia delle cellule dell’organo del Corti, le quali rispondono con un potenziale elettrico che viene trasmesso alle terminazioni nervose da cui sono raggiunte. La membrana basilare è lunga in tutto circa 33 mm e contiene circa 30 000 cellule ciliate dell’organo del Corti. Le sue dimensioni e la sua flessibilità variano lungo il percorso, infatti è più rigida e di larghezza pari a circa 100 µm alla base (verso la finestra ovale), mentre è più flessibile e larga circa 500 µm verso l’apice (verso l’elicotrema).
Figura 4.12: Membrana basilare
Le differenti dimensioni e flessibilità permettono alla membrana basilare di entrare in risonanza, e dunque oscillare, solo a determinate frequenze per ogni singola porzione di membrana. Più ci avviciniamo all’apice, più la membrana basilare entrerà in risonanza con frequenze basse, più ci avvicinia-
83
4 Principi di anatomia e neurofisiologia mo alla base, più risponderà oscillando a frequenze elevate. Questa speciale caratteristica della membrana basilare è denominata tonotopicità. La distribuzione delle frequenze di risonanza sulla membrana basilare è in scala logaritmica rispetto alla sua lunghezza, fatto sorprendentemente compatibile con la suddivisione in ottave (2n ) del sistema musicale. Le frequenze da 20 Hz a 4000 Hz circa coprono i due terzi dell’estensione della membrana basilare a partire dall’apice, mentre le restanti da 4000 Hz a 20 000 Hz sono compresse nell’ultimo terzo fino alla base. Come abbiamo visto precedentemente infatti, consideriamo suoni musicali, i suoni fino a circa 4000 Hz!
Figura 4.13: Tonotopicità della coclea
L’intensità del suono è determinata in base all’ampiezza della vibrazione della membrana basilare: tanto è maggiore l’oscillazione della membrana, tanto più intensamente sono stimolate le cellule ciliate, e tanto maggiore sarà la quantità di impulsi trasmessi al sistema nervoso per segnalare il grado di intensità sonora. La minima vibrazione efficace della membrana basilare, conseguente a uno stimolo sonoro di frequenza
84
4.5 Vie nervose ottimale (tra i 1000 Hz e i 3000 Hz), è pari a circa 10−11 cm, il che denota l’estrema sensibilità dell’apparto uditivo, dato che questa grandezza è inferiore persino al diametro di un atomo di idrogeno (10−8 cm).
4.5 Vie nervose L’vii nervo encefalico è un nervo sensitivo puro con due componenti: la radice cocleare per l’organo dell’udito e la radice vestibolare per l’organo dell’equilibrio. Le informazioni concernenti la funzione dell’equilibrio e dell’udito raggiungono il sistema nervoso centrale attraverso due rami separati, il nervo vestibolare che origina dal Ganglio dello Scarpa e il nervo cocleare proveniente dal Ganglio Spirale. Insieme formano l’8° nervo cranico che fuoriesce dal meato acustico interno assieme al nervo facciale ed entra nel bulbo subito sotto il ponte. La destinazione finale dei messaggi provenienti dalle strutture recettoriali della coclea, è la corteccia acustica o corteccia uditiva primaria, un’area della corteccia temporale (giro temporale superiore) presente su entrambi gli emisferi cerebrali. Anche le corteccie acustiche, così come tutte le strutture neurali interposte tra la corteccia e l’organo del Corti, sono organizzate tonotopicamente come la coclea.
4.6 Battimenti primari e bande critiche Il pitch, la percezione dell’altezza di un suono, è una sensazione soggettiva che dipende da una molteplicità di fattori concomitanti. In psicoacustica, la misura di minima differenza
85
4 Principi di anatomia e neurofisiologia apprezzabile (just noticeable difference, jnd) è lo strumento utilizzato per determinare il valore soglia al di sopra del quale sia possibile distinguere tra due stimoli dissimili. Il jnd del pitch o soglia differenziale per la frequenza, è dunque lo strumento col quale si misura la minima differenza apprezzabile tra due frequenze differenti non contemporanee (intervallo melodico). Gli studi in merito hanno mostrato che dipende sia dalla frequenza iniziale che dall’intensità sonora, ma anche dalla durata e dalla velocità con cui la frequenza viene variata. In media, si può dire che la massima risoluzione si ottiene per frequenze intorno ai 2000 Hz (6a ottava) in cui è di circa 0.5% della frequenza iniziale. A queste frequenze è possibile distinguere due suoni (successivi, non contemporanei) di cui il secondo abbia frequenza almeno maggiore o almeno minore dello 0.5% della frequenza iniziale. Al di sotto e al di sopra, la jnd aumenta e raggiunge il suo massimo, quindi il minimo potere risolutivo, per le basse frequenze, minori di 100 Hz circa dove è del 3% circa. Per frequenze superiori a 4000 Hz il jnd sale allo 0.6%. La causa di questo fenomeno è da attribuirsi alle proprietà meccaniche della membrana basilare, di cui abbiamo parlato. I battimenti primari sono la percezione di modulazioni nell’ampiezza di un’onda sonora costituita (nel caso più semplice) da due frequenze contemporanee (intervallo armonico) la cui differenza sia minore di 15-20 Hz. In questo caso, viene percepita una fluttazione nell’intensità del suono e una frequenza unica pari alla media aritmetica tra le due frequenze originarie. L’effetto è verosimilmente dovuto al fatto che due frequenze “troppo vicine” presentate contemporaneamente inducono la risonanza della stessa porzione di membrana basilare che dunque vibra riproducendo la modulazione d’ampiezza del suono. Infatti, dal punto di vista fisico, l’inviluppo
86
4.6 Battimenti primari e bande critiche dell’onda presenta esattamente la stessa frequenza di variazione d’intensità del battimento percepito. Se, per esempio, osserviamo l’inviluppo dell’onda somma delle frequenze 150 e 154 Hz (fig. 4.14) noteremo chiaramente la modulazione in ampiezza della frequenza di 154 − 150 = 4 Hz.
Figura 4.14: Battimento primario da 4 Hz: ν1 = 150 Hz e ν2 = 154 Hz
I battimenti sono considerati sgradevoli in quanto perturbano l’ascolto e in quanto non è possibile percepire le due frequenze esatte ma, chiamando ν1 e ν2 le due frequenze, si percepisce un suono di frequenza pari (ν1 + ν2 ) /2 . Il limite della percezione dei battimenti è indipendente dalla frequenza, essendo di 15-20 Hz per tutte le frequenze, dalle più gravi alle più acute. Dato però che gli intervalli musicali sono in scala logaritmica e non lineare, differente per ogni intervallo è il limite di frequenza al di sotto del quale la differenza tra le frequenze che lo compongono è minore di 20 Hz. In figura 4.15 sono mostrati i limiti di battimento per tutte gli intervalli della scala di giusta intonazione. La curva che descrive il limite è stata calcolata quale 0 = yx − x − 20, dove x è la frequenza fondamentale dell’intervallo (la frequenza più
87
4 Principi di anatomia e neurofisiologia
Figura 4.15: Soglia dei battimenti
grave), y è la ratio dell’intervallo (dunque ci interessa tra 1 e 2, quindi nell’arco di una ottava) e 20 è limite di differenza per i battimenti primari. Oltre i 15-20 Hz circa, la percezione dei battimenti scompare ma inizia una sgradevole percezione di “ruvidità”. Oltre una certa soglia, è invece possibile percepire due suoni ben distinti e non sgradevoli. Questa soglia è chiamata larghezza di banda critica (critical bandwidth, cb) e il suo valore è direttamente legato alla jnd. Indicando con ∆νCB il valore soglia della banda critica, l’intera banda critica è pari a 2∆νCB dato che si estende sia al di sopra che al di sotto della frequenza centrale. La relazione tra banda critica e jnd può essere sintetizzata come: ∆νCB = 30 · JND Una banda critica corrisponde a circa 1.3 mm di membrana
88
4.6 Battimenti primari e bande critiche basilare e a circa 1300 cellule ciliate dell’organo Corti. Dunque, qualunque suono costituito da due frequenze all’interno delle reciproche bande critiche sarà percepito come sgradevole e dunque si dirà che l’intervallo è fortemente dissonante. Questa è una prima, semplice, definizione di dissonanza. È infatti solamente in grado di spiegare perché gli intervalli di seconda minore (2m, ratio 16 15 ) e seconda maggiore (2M, ratio 98 ) siano sempre percepiti come dissonanze a prescindere dall’altezza della frequenza più grave, mentre per esempio la 3m sia percepita come dissonante solo alle basse frequenze. Infatti le due seconde non superano mai la soglia della cb. Una formula empirica proposta da Moore e Glasberg nel 1983, valida tra i 100 e 10 000 Hz, ci può aiutare a comprendere cosa questo comporti per gli intervalli musicali. La formula, chiamata erb (Equivalent Rectangular Bandwidth) per la procedura con cui cui è stata trovata, è: ERB = 6.23 · 10−6 νc2 + 93.39 · 10−3 νc + 28.52
Hz
e ritorna il valore della banda critica (metà banda critica) al variare della frequenza centrale νc . In figura 4.16 è riprodotto un grafico nel quale è possibile distinguere la erb (la curva scura superiore) e il limite di battimento (la retta scura inferiore parallela all’asse delle x) le quali delimitano due aree: l’area dei battimenti, inferiormente, ovvero l’area entro la quale due frequenze producono battimento primario; l’aera della banda critica che rappresenta l’area entro la quale una frequenza si trova entro un banda critica. Al di sotto dell’area della banda critica l’intervallo verrà percepito come sgradevole e al di sopra come non sgradevole. Non utilizziamo appositamente il termine consonante dato che, come abbiamo già visto, questo termine in musica ha un preciso significato armonico. La “non sgradevolezza” è definita più
89
4 Principi di anatomia e neurofisiologia propriamente come consonanza sensoriale per distinguerla appunto dalla consonanza tonale che è il concetto musicale.
Figura 4.16: Banda critica (erb) e soglia dei battimenti
Possiamo notare che 2m e 2M non escono mai dall’area di banda critica; sono due intervalli che, a prescindere dall’altezza dei suoni, verranno sempre percepiti come sgradevoli. Questo è in accordo con la definizione musicale di questi due intervalli come dissonanze. Tant’è che molto raramente gli intervalli di seconda vengono usati in quanto tali, ma nella stragrande maggioranza dei casi, vengono aumentati all’ottava superiore (nona minore e nona maggiore) per diminuire il grado di dissonanza provocato appunto dal fenomeno dei battimenti e delle bande critiche. La terza minore invece esce dall’area di banda critica per una frequenza pari a circa 272 Hz. Il che significa che al di sotto di questa frequenza l’intervallo di 3m sarà percepito come non gradevole. Al di sopra
90
4.6 Battimenti primari e bande critiche dei 272 Hz sarà al contrario percepito come sensorialmente consonante. La terza maggiore esce dall’area di banda critica attorno ai 183 Hz, al di sopra dei quali sarà percepita come consonanza sensoriale. Sono entrambi valori piuttosto alti dal punto di vista musicale perché ci troviamo già nella 3a ottava, infatti 272 Hz corrisponde a circa C4 -C�4 e 183 Hz a circa F�3 . Ecco probabilmente uno dei motivi, ma sicuramente non l’unico, per cui le consonanze tonali di 3m e 3M sono definite imperfette: si possono utilizzare in quanto tali solo a partire dall’ottava centrale, perché al di sotto sono percepite come sgradevoli e infatti, anche in questo caso, vengono spesso prese un’ottava sopra (decima minore e decima maggiore). La 4P esce dall’area di banda critica a circa 119 Hz, che corrisponde in note a circa A�2 . È un valore sufficientemente basso dato che difficilmente si usano accordi in un registro così grave, che è solitamente deputato allo sviluppo della linea melodica del basso che agisce, soprattutto, dal E1 di circa 42 Hz al C3 di circa 131 Hz. Il limite di banda critica della 5P non è visualizzabile in questo grafico dato che la formula di Moore e Glasberg è valida fino al limite inferiore di 100 Hz. È comunque possibile supporre che la 5P sia verosimilmente sempre fuori dall’area di banda critica o comunque ne esca per una frequenza decisamente accettabile, tanto da poter essere definita quale consonanza perfetta. Sappiamo comunque che esce dall’area dei battimenti per una frequenza pari a 40 Hz (fig. 4.15) che è un valore decisamente accettabile essendo pari a circa D�1 , una nota un semitono più grave della nota più grave di un contrabbasso. Ovviamente, la condizione di essere fuori dall’area di banda critica è necessaria ma non sufficiente per definire un intervallo tonalmente e dunque musicalmente consonante. Infatti vi sono molti intervalli, come la 6m, la 7m e la 7M (o le due
91
4 Principi di anatomia e neurofisiologia none a cui abbiamo accennato) che sono sicuramente sempre al di sopra del limite di banda critica ma sono definiti (e percepiti) come dissonanze anche se, sottolineiamo nuovamente, tra dissonanza musicale e sgradevolezza sensoriale vi è una notevole differenza qualitativa.
4.7 Armoniche auricolari e suoni di combinazione A causa della conformazione dell’apparato uditivo, ad alti volumi e per intensità sonore sufficientemente elevate, il sistema di trasmissione dell’onda sonora si comporta come un amplificatore a distorsione non lineare. Questa distorsione comporta l’origine di suoni non presenti nello stimolo orginale che vengono complessivamente chiamati suoni di combinazione o prodotti di intermodulazione se sono prodotti a seguito di uno stimolo contenente due frequenze contemporanee (intervallo armonico) e armoniche auricolari se sono prodotti a fronte di un solo suono puro. Le armoniche auricolari hanno frequenza pari agli armonici dello stimolo sonoro: se chiamiamo ν la frequenza dello stimolo originario, le armoniche auricolari avranno frequenza pari a 2ν, 3ν, 4ν . . . nν. I suoni di combinazione, o prodotti d’intermodulazione, invece sono molteplici e sono suddivisi in ordini. Chiamando ν1 e ν2 le due frequenze componenti lo stimolo originale, i prodotti del prim’ordine sono ν2 − ν1 chiamato prodotto quadratico o tono di differenza quadratica o Terzo Suono di Tartini (da Giuseppe Tartini che per primo lo descrisse nel 17142 ), e ν2 + ν1 2 In
realtà il primo a dichiarare la sua descrizione fu l’organista tedesco Sorge nel 1744. Solo successivamente il violinista italiano Giuseppe
92
4.7 Armoniche auricolari e suoni di combinazione chiamato prodotto somma. I prodotti di second’ordine sono invece gli armonici auricolari 2ν1 e 2ν2 e i prodotti 2ν2 − ν1 e 2ν1 − ν2 . Quest’ultimo è chiamato anche prodotto cubico o tono di differenza cubica ed è il più importante, insieme al Terzo Suono di Tartini, essendo udibile anche a intensità moderate. Il Terzo Suono di Tartini in realtà è percepibile a livelli di volume più elevati del prodotto cubico. È però importante notare che ν2 −ν1 è anche il risultato dell’interferenza semplice delle due frequenze stimolo. È quindi probabile che giochi un ruolo piuttosto importante nella determinazione della consonanza di un intervallo, non come prodotto di intermodulazione per distorsione non lineare, ma come semplice proprietà fisica delle onde sonore. È anche curioso notare che i prodotti di intermodulazione sono i medesimi in tutti gli amplificatori a distorsione non lineare, anche in quelli elettronici, tanto da essere descritti con precisione nei manuali di elettronica e telecomunicazione. Battimenti primari, banda critica, armoniche auricolari e prodotti d’intermodulazione sono tutti effetti chiamati effetti primari o effetti di I ordine, causati dalla trasmissione dello stimolo sonoro dall’orecchio esterno all’orecchio interno. Effetti secondari o di II ordine sono invece chiamati quei fenomeni che si presume dipendano dall’elaborazione degli stimoli a livello neurale e corticale.
Tartini dichiarò di averlo già scoperto nel 1714.
93
5 Consonanze e dissonanze in giusta intonazione bbiamo visto nel precedente capitolo come il fenomeno A dei battimenti primari e della larghezza di banda critica possano spiegare alcune delle proprietà di alcuni intervalli de-
finiti dissonanti in musica. Non possono però spiegare perché, ben al di sopra della banda critica, alcuni intervalli risultino consonanti e altri dissonanti, né perché si possa definire in modo abbastanza preciso il grado di consonanza o dissonanza di un determinato intervallo. Per prima cosa, riprendiamo la scala di giusta intonazione e le definizioni di consonanza legate a ciascun intervallo (tabella 5.1).
L’intervallo di unisono è l’intervallo consonante per definizione visto che è formato dalla stessa nota suonata contemporaneamente, dunque possiamo non occuparcene ma posturarlo in quanto base dei concetti di semplicità e complessità che stiamo per introdurre. Possiamo subito notare un fatto molto importante: quelle che sono definite consonanze perfette hanno rapporti molto semplici e indicando con N il
95
5 Consonanze e dissonanze in giusta intonazione ratio
T
st
CP
1P
1
0
0
�
2m
1/2
1
1
2
11/2
3
7M
16 15 9 8 6 5 5 4 4 3 45 32 3 2 8 5 5 3 9 5 15 8
8P
2
2M 3m 3M 4P 4� 5P 6m 6M 7m
2
4
21/2
5
3
6
31/2
7
4
8
41/2
9
5
10
51/2
11
6
12
CI
d
m
f
ff
� � � � � � � � � � � �
Tabella 5.1: Intervalli (T = toni; st = semitoni; consonanze: CP = perfetta, CI = imperfetta; dissonanze: d = debole, m = media, f = forte, ff = molto forte)
numeratore e con M il denominatore possiamo definirle in quanto N = M + 1 con 1 ≤ M ≤ 5. In altre parole, come già sappiamo, possono essere viste come il rapporto tra armonici consecutivi di un suono, entro il VI. Per quanto riguarda gli altri intervalli possiamo notare che la complessità dei rapporti aumenta proporzionalmente alla definizione di dissonanza: gli intervalli caratterizzati dai rapporti più complessi sono anche quelli definiti musicalmente come più dissonanti. Il motivo di questa distinzione è da ricercare nella particolare regolarità degli intervalli definiti dai rapporti più semplici. Indicando sempre ν2 la frequenza più acuta, ν1
96
la frequenza più grave e il loro rapporto come ν2 =
N ν1 M
e data la definizione di periodo T = 1/ν, la precedente uguaglianza può essere scritta come T2 =
M T1 N
Pertanto N T2 = M T1 Dunque l’N periodo del suono di frequenza ν2 coincide con l’M esimo periodo del suono di frequenza ν1 o meglio: esimo
aN T2 = aM T1 dove a è un numero naturale maggiore di zero. Questa uguaglianza significa che ogni aN esimo periodo di ν2 coincide con l’aM esimo periodo di ν1 . Dunque, minori sono M ed N , maggiore è il grado di quella che chiameremo semplicità razionale tra le due frequenze. Per l’intervallo di unisono la semplicità razionale è totale dato che tutti i periodi di entrambi i suoni coincidono perfettamente. Per l’intervallo di ottava, definito dalla ratio 2/1, consegue che tutti i periodi di ν2 coincidono con ν1 ogni 2 periodi di quest’ultima. Ecco perché note a distanza di ottava vengono chiamate con lo stesso nome. Se estendiamo, possiamo dire che per due frequenze con ratio 2n /1, tutti i periodi della frequenza più grave coincidono con un periodo della frequenza più acuta ogni 2n . All’aumentare di N ed M , diminuisce quindi la semplicità razionale tra le due
97
5 Consonanze e dissonanze in giusta intonazione frequenze, e quindi la perfetta coincidenza tra i periodi dei due suoni, e aumenta quella che chiameremo complessità razionale. Possiamo dunque porre, come indice di complessità di un’intervallo, ovvero come indice del discostamento dalla condizione perfetta di unisono, IC = N + M − 2. Sottraiamo 2 dalla somma N + M per ottenere 0 per l’intervallo di unisono definito dalla ratio 1/1. Se dunque ordiniamo gli intervalli della scala di giusta intonazione in base al loro IC otteniamo una sequenza in ordine crescente di complessità (tabella 5.2). IC
ratio
T
st
CP
1P
0
1
0
0
�
8P
1
2
6
12
�
5P
3
3 2 4 3 5 3 5 4 6 5 8 5 9 5 9 8 15 8 16 15 45 32
31/2
7
�
21/2
5
�
41/2
9
2
4
�
11/2
3
�
4
8
�
5
10
�
1
2
�
51/2
11
�
1/2
1
�
3
6
4P
5
6M
6
3M
7
3m
9
6m
11
7m
12
2M
15
7M
21
2m
29
4�
75
CI
d
m
f
ff
�
�
Tabella 5.2: Intervalli (T = toni; st = semitoni; consonanze: CP = perfetta, CI = imperfetta; dissonanze: d = debole, m = media, f = forte, ff = molto forte)
Vediamo che tutti gli intervalli (tranne la 6M) sono in ordine secondo la loro definizione di consonanza o dissonanza.
98
Ipotizziamo ora che il risultato dell’interferenza semplice ν2 − ν1 (che è anche il prodotto quadratico d’intermodulazione, il Terzo Suono di Tartini) e il prodotto cubico 2ν1 − ν2 , siano coinvolti nella consonanza e/o dissonanza di un intervallo e proviamo e calcolare a cosa corrispondono per ciascun intervallo della scala di giusta intonazione. Indicheremo con qdf (quadratic difference tone) e cdf (cubic difference tone) i risultati dei due prodotti e li riporteremo in ottava per comprendere meglio il loro eventuale significato armonico (figura 5.1).
Figura 5.1: qdf e cdf degli intervalli di giusta intonazione
Da una prima analisi possiamo notare che, fino alla 3M in ordine crescente di complessità, sia il qdf che il cdf sono consonanze perfette, avendo a loro volta basso indice di complessità. In particolare notiamo anche che la 6M è l’ultimo dei rapporti più semplici con qdf e cdf aventi il medesimo significato armonico, anche se posti ad intervallo di ottava tra loro. Osserviamo ora più nel dettaglio ciascun intervallo e i suoi prodotti. L’intervallo di unisono ha ovviamente un qdf nullo, dato che le due frequenze sono esattamente identiche e il risultato
99
5 Consonanze e dissonanze in giusta intonazione del cdf è, altrettanto ovviamente, pari a se stesso visto che equivale a 2ν1 − ν1 . Anche i qdf e i cdf dell’intervallo di ottava sono piuttosto intuitivi, infatti il qdf è 1 quindi uguale a ν1 e il cdf è ovviamente nullo visto che ν2 = 2ν1 dunque 2ν1 − 2ν1 = 0. L’intervallo di quinta giusta comincia ad essere decisamente più interessante. Notiamo infatti che sia il qdf che il cdf sono di 12 , pari alla fondamentale 1P un’ottava sotto. Questo è l’unico intervallo della scala di giusta intonazione ad avere qdf = cdf; per tutti gli altri intervalli i due prodotti non coincidono perfettamente, infatti, anche in quelli dove il prodotti quadratico e il prodotto cubico hanno medesimo significato armonico, si trovano ad almeno una ottava di distanza. Questa poprietà della 5P, oltre a contruibuire sicuramente alla sua condizione di consonanza perfetta, è sfruttata in musica, soprattutto in strumenti come gli organi a canne che sono ancora intonati secondo la scala di giusta intonazione oppure con temperamenti molto meno aggressivi dell’attuale temperamento equabile. Il fenomeno è sfruttato per produrre appunto un suono fantasma che si trovi un’ottava sotto alla frequenza dei due suoni reali. Suonando per esempio C2 e G2 , otterremo un qdf = qdf = C1 cioè la fondamentale un’ottava più sotto. Come infatti comferma Nicola Ferroni, di Nuova Musica Antica, esperto in costruzione d’organi, «il fenomeno del terzo suono [NdA: di Tartini, il qdf] è abbondantemente sfruttato in organi grandi per i registri più ingombranti, pesanti e costosi: un Contrabasso di 32’ reale ha la prima canna lunga 10 metri e larga 60 cm o anche più e da sola pesa e costa parecchio, quindi si costruiscono con buoni risultati due canne, una di 16’ e una
100
di 10.2/3’ (quindi l’ottava e la XII sopra il suono cercato)1 che, accordate perfettamente pure, senza battimenti, producono assieme un adeguato effetto di gravità. Teoricamente è ottenibile lo stesso terzo suono sommando due note a distanza di quarta pura, ma questo sistema non è applicato, che io sappia2 . Invece dall’accordatura perfetta dei registri di mutazione composta3 (sesquialtera e cornetto, con canne che suonano gli armonici di VIII, XII, XV e XVII oppure ripieno, con gli armonici VIII, XII, XV, XIX, XXII, XXVI, XXIX)4 si ottengono sonorità molto amplificate, al punto che in certi rari casi ben riusciti sembra addirittura che anzichè suonare nella normale tessitura di 8’ si stia trasponendo all’ottava inferiore» e aggiunge «per esigenze di spazio o soprattutto economiche talvolta gli organari usano le canne di uno stesso registro per ottenere il risultato, sennonché le quinte appena strette del temperamento equabile non sempre si prestano bene all’effetto5 , inoltre l’intonazione (cioè il giusto 1 La
dodicesima è la 5P un’ottava sopra, dunque per ottenere il suono ν, si costruisce una canna che riproduce 2ν e una canna 3ν = 2 32 ν. qdf e cdf di questo intervallo sono 3ν − 2ν = ν e 2 · 2ν − 3ν = ν. 2 Il fatto che il terzo suono come somma di due suoni a distanza di quarta non sia utilizzato (nella costruzione degli organi) è pure comprensibile dato che solo nella 5P i due prodotti sono, come abbiamo visto, perfettamente coincidenti e uguali alla 1P un’ottava sotto, mentre nella 4P avremo due prodotti con medesimo significato armonico ma distanti un’ottava. 3 I registri di mutazione composta sono registri che azionano più di una fila di canne alla volta. 4 In questo caso abbiamo le coppie VIII-XII (quindi 8P e 5P un’ottava sopra), XV-XIX (8P un ottava sopra e 5P due ottave sopra) e XXIIXVI (8P due ottave sopra e 5P tre ottave sopra) che danno tre qdf un’ottava sotto al suono più grave della coppia 5 Infatti nel temperamento equabile la 5P non corrisponde a 3 ma a 2 27/12 , dunque ovviamente i prodotti non corrisponderanno esatta-
101
5 Consonanze e dissonanze in giusta intonazione equilibrio timbrico e dell’intensità sonora) non è finalizzata principalmente a favorire la fusione dei due suoni»6 . Dunque, soprattutto nel registro grave, i due prodotti risultano essere una caratteristica importante dell’intervallo di quinta giusta, tanto da essere sfruttato come espediente tecnico dagli organari per risparmiare sulle pesanti canne che servirebbero per creare suoni così gravi. Anche i prodotti della quarta giusta sono molto interessanti, dato che sono sempre due quarte giuste, rispettivamente due e una ottava sotto. Se suoniamo C3 e F3 , otterremo un qdf = F1 e un cdf = F2 . Anche questa caratteristica, sebbene non possa essere musicalmente sfruttata per creare lo stesso effetto dei prodotti della 5P, rende conto dell’importanza dell’intervallo di quarta giusta che, di fatto, è definito anch’esso come consonanza perfetta. Con la quarta giusta si chiude l’insieme degli intervalli definiti musicalmente come consonaze perfette. Ci aspettiamo quindi, d’ora in poi, di trovare delle differenze significative non solo nell’IC ma anche nei due prodotti. Notiamo che, per tutte le consonanze perfette, qdf e cdf sono armonicamente pari ad una delle due note che compongono l’intervallo, anche se nel caso della 4P distano un’ottava. Se osserviamo ora la 6M, ci rendiamo conto che effettivamente esistono delle differenze. Sia il qdf che il cdf della sesta maggiore sono armonicamente una 4P, ma rispettivamente una e due ottave più gravi. Questo significa che se suoniamo per esempio C3 e A3 , otterremo qdf = F2 e cdf mente alla 1P e non avremo l’effetto desiderato, infatti il qdf è di 27/12 − 1 ≈ 0.4983 e il cdf è 2 − 27/12 ≈ 0.5017 con errore dunque di ratio pari circa 0.0034 · ν1 . Ai registri bassi, per esempio a 55 Hz (A1 ) significa un errore di circa 0.1862 Hz 6 Conversazione privata con Nicola Ferroni.
102
= F1 . Dunque i due prodotti aggiungono una nota non appartenente allo stimolo originario. È però importante notare che la nota aggiunta dai due prodotti non è completamente estranea all’intervallo suonato. Infatti, una terna F2 �C3 �A3 è una triade maggiore di F2 a rapporti lati, con la 3M un’ottava sopra (decima maggiore). Dunque, suonando un C3 e un A3 , dal punto di vista dei prodotti quadratico e cubico, queste note non sono prima e sesta maggiore ma bensì quinta giusta e decima maggiore (la terza maggiore un’ottava più acuta) di un F2 . Questa proprietà avrà importanza quando parleremo delle consonaze stonate in accordi di tre suoni e rende probabilmente conto di un particolare effetto percettivo chiamato rintracciamento della fondamentale o virtual pitch. È un effetto annoverato tra gli effetti di II ordine dovuti all’elaborazione degli stimoli da parte del sistema nervoso, a differenza di quelli di I ordine che sono dovuti alla trasmissione dei suoni dall’orecchio esterno all’orecchio interno (come gli armonici auricolari e gli stessi prodotti d’intermodulazione). Il rintracciamento della fondamentale si verifica soprattutto per suoni complessi (contenenti armonici) a cui sia stato tolto l’armonico fondamentale. Un suono di frequenza ν, avrà armonici pari a 2ν, 3ν, 4ν . . . nν e sarà percepito e chiamato col nome della frequenza fondametale. Se togliamo ν, la fondamentale, dalla sequenza di armonici, il suono è comunque percepito come un suono complesso di frequenza ν. Di fatto, ν è il Massimo Comun Divisore di tutti i suoi armonici, ma è anche il qdf (e il prodotto d’interferenza semplice) tra ciascun armonico e il successivo. Dunque avremo n prodotti quadratici identici e pari esattamente a ν. Questo fenomeno però si ottiene anche suonando due note a intervallo di 5P, in cui viene generata la sensazione di un suono pari 12 ν, che è però anche il risul-
103
5 Consonanze e dissonanze in giusta intonazione tato dei due prodotti quadratico e cubico e corrisponde al Terzo Suono di Tartini utilizzato anche come espediente tecnico dagli organari. Il ritracciamento della fondamentale per un intevallo di 4P invece risulta sperimentalmente pari a 13 ν, che ricordiamo è anche il risultato del qdf e dell’interferenza semplice tra le due frequenze componenti. Nonostante gli studi in merito abbiano dimostrato che non vi sono tracce di questi suoni nei pattern di vibrazione della coclea, la perfetta coincidenza di questi risultati pone in dubbio il fatto che l’effetto chiamato rintracciamento della fondamentale sia solo un effetto di II ordine senza alcun corrispettivo di I ordine. Ricordiamo infatti che la minima vibrazione efficace della membrana basilare, in grado di produrre un potenziale di membrana e quindi l’impulso nervoso, è più piccola di due ordini di grandezza rispetto al diametro di un atomo di idrogeno! Questo può far supporre che i movimenti della membrana stessa, causati dall’interferenza semplice tra le due frequenze (che è pari al qdf) in questi casi particolari, siano talmente piccoli da non poter essere registrati in vivo e che in vitro, su campioni prelevati da animali non più in vita e analizzati in laboratorio, i processi conseguenti alla morte dell’animale alterino le proprietà di flessibilità della membrana basilare e la composizione del liquido endolinfatico della scala cocleare7 , producendo dunque anche alterazioni nei delicati equilibri che ne determinano i movimenti microscopici. 7 Di
fatto la composizione ionica dell’endolinfa è di somma importanza per il corretto funzionamento delle cellule dell’organo del Corti ed è mantenuta in vivo da una speciale pompa Na-K (sodio-potassio) che assicura un potenziale positivo (80 mV) all’interno della scala cocleare rispetto alla perilinfa.
104
Continuiamo nell’analisi dei prodotti degli intervalli di giusta intonazione. Dopo la 4P, in ordine di complessità, troviamo la terza maggiore. qdf e cdf di questo intervallo non coincidono ma il qdf è pari alla frequenza fondamentale due ottave più grave e il cdf è pari alla 5P, non presente nello stimolo originario, un’ottava più grave. È utile comprendere meglio il significato armonico dei prodotti di questo intervallo con un esempio: se prendiamo C3 come ν1 e dunque E3 come ν2 , avremo un qdf pari a C1 e un cdf pari a G2 , quindi in tutto C1 �G2 �C3 �E3 : una triade maggiore di C. La terza maggiore è definita come consonanza imperfetta, infatti possiede un IC ancora piuttosto basso e due prodotti compatibili con il suo significato armonico. La terza minore ha invece prodotti più particolari ma ugualmente interessanti, ed entramni eguali alla 6m, rispettivamente tre e una ottava più gravi. Prendiamo come esempio un intervallo C4 �E�4 : avremo un cdf pari A�3 e qdf a A�1 . A�1 è piuttosto lontano dai due suoni originari, mentre A�3 si trova solamente ad una terza maggiore da C4 . Dunque avremo (tralasciando il A�1 ) A�3 �C4 �E�4 : una triade maggiore di A�. Dunque, nonostante i prodotti aggiungano una nota non originariamente presente nello stimolo iniziale, la loro ratio è semplice. La terza minore è definita musicalmente come consonanza imperfetta ed è l’ultima delle consonanze in ordine ascendente di complessità. Immediatamente dopo la terza minore, troviamo dunque la prima dissonanza media propriamente detta: la sesta minore con qdf pari alla terza minore un’ottava sotto e cdf pari alla sesta minore due ottave più grave. Notiamo una certa somiglianza con i prodotti della 3m, infatti usando come esempio C4 �A�4 avremo E�3 come qdf e A�2 come cdf, quindi A�2 �E�3 �C4 �A�4 nuovamente una triade maggiore di 105
5 Consonanze e dissonanze in giusta intonazione A� ma a rapporti lati. Dunque, non solo il suo indice di complessità, ma anche il suo rapporto con i suoi prodotti, possono essere una spiegazione del perché l’intervallo di 6m sia percepito come dissonanza ma non altrettanto forte come le successive. La settima minore è la seconda delle dissonanze medie. I suoi prodotti sono pari alla 6m, una e tre ottave più gravi. Siamo effetivamente di fronte alla prima vera dissonanza, in quanto i suoi prodotti non formano con le due note originarie intervalli semplici. La seconda maggiore è invece la prima delle dissonanze forti. Su questo intervallo già sappiamo che è sempre compreso nella banda critica e che inizia ad avere un elevato IC , ma vediamo anche che il suo prodotto più vicino, il cubico, non solo non corrisponde a nessuna delle due note presenti nelle componenti, ma addirittura è una frazione che esprime un intervallo non utilizzato nella scala di giusta intonazione: 78 che è 74 un’ottava più grave. Sapendo che le frazioni N/2n possono essere anche concepite come l’N esimo armonico della fondamentale, n ottave più grave, possiamo dire che 7/4 = 7/22 di un suono ν corrisponde al 7° armonico di ν due ottave più grave. Esprimendolo come numero razionale possiamo meglio comprendere la sua posizione in una ipotetica scala che lo comprenda: 7/4 = 1.75. Considerando che la ratio della 6M è 5/3 = 1.6 e che quella della 7m è pari a 9/5 = 1.8 , possiamo considerare 74 come una settima minore calante. In realtà però l’armonico 7ν è già presente nello spettro di un suono complesso, mentre la ratio 59 può solo essere vista come rapporto tra il 9° e il 5° armonico, ma non esiste nella composizione armonica di un suono reale. Questo rapporto infatti, non è nuovo in musica. Durante la storia è comparso più volte, in quanto settima minore, prima della formulazione della Scala di Giusta Intonazione da parte
106
di Gioseffo Zarlino, e successivamente in altre scale create a scopo di ricerca artistica. Nonostante la caratterista di essere in rapporto d’ottava con un armonico della fondamentale però, non ha invece alcun rapporto rilevante con nessuno degli altri intervalli (soprattutto dei gradi principali 1P, 4P e 5P) del resto della scala. La 7m di 95 invece, come ricordiamo, è costruita in quanto terza minore della quinta giusta, dunque ha un rapporto di consonanza imperfetta con uno dei gradi principali, una consonanza perfetta. Un intervallo di 74 posto all’interno di una composizione musicale quindi, pur essendo sensorialmente consonante ovvero non sgradevole, risulterà come stonato rispetto allo sviluppo armonico e melodico precedente, a meno che l’intera scala non venga costruita secondo differenti principi matematici e armonici. Anche la 7M ha un prodotto pari a 78 corrispondente a 74 un’ottava più grave. Entrame sono definite come dissonanze forti. La seconda minore è la più complessa delle dissonanze forti, secondo l’indice di complessità, e sappiamo anche che, come per la seconda maggiore, non esce mai dall’area di banda critica. Notiamo però che oltretutto ha un cdf di 14 15 senza alcun significato armonico, mentre il qdf è pari alla 2m quattro ottave più grave. Siamo finalmente arrivati al centro dell’universo tonale: la quarta aumentata. Pur essendo fuori dall’area di banda critica, è considerato l’intervallo più dissonante di tutto il sistema musicale. Infatti notiamo che ha un IC notevolmente più elevato degli intervalli che lo precedono e che entrambi i suoi prodotti non hanno armonicamente nessun significato. È però l’esatta ratio del rapporto tra la 4P e la 7M; è pertanto un’intervallo che pur essendo altamente dissonante, quasi sgradevole se presentato da solo, acquista significato comuni-
107
5 Consonanze e dissonanze in giusta intonazione cativo all’interno di una composizione musicale. La tensione che l’elevata dissonanza di questo intervallo produce va preparata e poi risolta su un accordo consonante. Il movimento di parti che porta dalla tensione alla sua risoluzione è 4P → 3M 7M → 1P Da un intervallo altamente dissonante di quarta aumentata dato dalla coppia 4P�7M, la quarta scende di semitono alla terza maggiore e la settima maggiore sale di semitono alla tonica, ottenendo un intervallo di terza maggiore, dunque consonanza imperfetta, formato proprio dalla tonica e dalla sua 3M. È d’obbligo sottolineare che, nel sistema a giusta intonazione, non solo in una scala esiste un solo intervallo di quarta aumentata, ma addirittura un determinato intervallo di quarta aumentata può appartenere ad una e una sola scala. Dunque la 4� è la base del concetto di tonalità. Nel sistema a giusta intonazione, se viene presentata la coppia F�B (anche all’interno di un accordo) l’orecchio dell’ascoltatore si aspetta di essere in tonalità di C maggiore (nella scala maggiore di C) perché è l’unica scala che contiene queste note specifiche in questo specifico rapporto. Per i musicisti che stanno leggendo, e che hanno qualche nozione in più di armonia rispetto ai brevi cenni presentati in questo libro, ricordiamo che gli unici due accordi di una scala maggiore che contengono la 4P e la 7M di una tonalità sono i V e il VII grado: in C maggiore sono G7 e BØ , che infatti sono entrambi accordi del gruppo di dominante (primario e secondario) la cui tensione è risolta efficacemente solo su uno degli accordi di tonica (I, IIIm e VIm) nella cosiddetta cadenza perfetta V7 ⇒I. La cadenza perfetta, compresa di accordo di preparazione, è IV⇒V7 ⇒I. Il quarto grado (e il IIm che è sempre un accordo del gruppo di sottodominante), contiene la 4P ma non la 7M, dunque non
108
contiene la dissonanza di quarta aumentata presente nel V7 . Il movimento fondamentale delle parti nella cadenza perfetta preparata si riduce dunque a 4P→ 4P→ 3M 1P→ 7M→ 1P Da una consonanza perfetta a una dissonanza molto forte a una consonanza imperfetta sull’accordo maggiore di tonica, con semplici movimenti di semitono. Sottolineiamo che anche l’intervallo di quinta bemolle, il rapporto 7M�4P (o meglio 7M�11P), appartiene ad una e una sola tonalità, ma in sistema a giusta intonazione non è esattamente uguale alla 4�, infatti è di 64 45 . Nel sistema a temperamento equabile, invece, i semitoni sono tutti uguali e sia la quarta aumentata che la quinta bemolle sono a pari 26/12 e sono chiamati complessivamente intervallo di tritono. Questo comporta che, per esempio, la coppia F�B in temperamento equabile sia omofona della coppia F�C� (o E��B), fatto che non si verifica in sistema a giusta intonazione. La coppia F�C� (o E��B) appartiene alla scala maggiore di G� (o F�), infatti sono la sua 7M e la sua 4P. Dunque in temperamento equabile, un accordo che contenga un determinata coppia di note in intervallo di tritono perde la sua relazione biunivoca con un determinata tonalità e può appartenere a due scale differenti, in cui anche le toniche sono tra loro in rapporto di tritono (C maggiore e G� o F� maggiore). È questo il significato ultimo del cosiddetto sostituto di tritono: l’accordo G7 (contenente F�B ma anche F�C�) può risolvere anche su su G� maggiore e, parallelamente, l’accordo D�7 (contenente F�C� ma anche F�B) può anche risolvere su C maggiore. Torniamo agli indici di complessità e ai prodotti quadratico e cubico ed estendiamo l’analisi ai rapporti nell’arco di due
109
5 Consonanze e dissonanze in giusta intonazione ottave (figura 5.2) che vengono chiamati intervalli composti, a differenza degli intervalli semplici che sono compresi in una ottava.
Figura 5.2: qdf e cdf entro due ottave
Notiamo che alcuni intervalli composti si sono infrapposti ai primi intervalli semplici (tra le consonanze perfette e imperfette). Dal punto di vista dell’indice di complessità la 12P, che corrisponde alla 5P un’ottava più acuta (ed è esattamente il 3° armonico della fondamentale), risulta più semplice della 5P stessa, anche se non possiede la caratteristica di avere qdf e cdf identici come la quinta giusta. Ha comunque un prodotto quadratico e cubico rispettivamente pari alla fondamentale un’ottava più acuta (8P, il 2° armonico) e la
110
fondamentale stessa. La 15P invece, che corrisponde alla fondamentale due ottave sopra (il 4° armonico) ha qdf e cdf differenti ma ugualmente consonanti con entrambe le frequenze componente. La decima maggiore è molto più interessante. Ha un IC minore del suo corrispettivo in ottava (la terza maggiore), qdf e cdf corrispondono esattamente alla 5P e alla fondamentale un’ottava sotto. Dunque anche i due prodotti sono più semplici rispetto a quelli della 3M che sono più lontani dalle due componenti. Ancora più interessante risulta la nona maggiore. Il suo corrispettivo in ottava è molto complesso, con un IC di 15 e un cdf non corrispondente a una ratio appartenente al nostro sistema musicale. La 9M invece, possiede un IC minore, pari a 11, un qdf corrispondente alla 3M e un cdf pari alla fondamentale, due ottave più grave. Pur non potendo ovviamente parlare di consonanza in questo caso, notiamo però che è molto meno complessa della 2M; inoltre possiamo essere certi che 9M è sempre fuori dall’area di banda critica. È infatti usata ad almeno una ottava di distanza dalla fondamentale. La 9m invece, ha indice di complessità maggiore e prodotti complessi tanto quanto la 2m. Però, essendo a distanza maggiore dalla fondamentale rispetto alla seconda minore, è sicuramente sopra l’area di banda critica. Infatti anche la seconda minore è usata almeno un’ottava sopra. In ultimo, notiamo che sia la 11P (4P un’ottava più acuta) che la 13M (6M un’ottava più acuta) hanno IC maggiore rispetto agli intervalli semplici corrispondenti e la 13M ha anche un qdf di nessun significato8 . Infatti la 13M e 11P 8 In
realtà anche 76 è un intervallo storicamente usato più volte e chiamato tono supermaggiore nella musica bizantina, che amalgamava
111
5 Consonanze e dissonanze in giusta intonazione sono considerate tensioni in armonia musicale e utilizzate in quanto tali per dare colore ad un accordo (specialmente agli accordi minori per la 11P e di settima di dominante per la 13M).
il calcolo pitagorico e quello aristossenico.
112
6 Analisi del sistema a giusta intonazione ata la particolare configurazione della scala di giusta D intonazione (con rapporti frazionari), ne consegue che gli intervalli tra le note non sono tutti uguali. Per meglio
comprendere le differenze tra i toni e i semitoni di ciascun intervallo nell’ottava, useremo i cents al posto delle frazioni; un cent (a volte abbreviato « cst ») è definito come milleduecentesima parte di una ottava. La formula per il calcolo dei cent è: � � N cent = 1200 · log2 M
6.1 Giusta intonazione e temperamenti Una ottava è formata da 1200 cents. Anzitutto è necessario dire che esistono, nella scala di giusta intonazione, due tipi di tono e due tipi di semitono: TG
TONO GRANDE ≈ 204 cents
Tp
TONO PICCOLO ≈ 182 cents
SD
SEMITONO DIATONICO ≈ 112 cents 113
6 Analisi del sistema a giusta intonazione Sc
SEMITONO CROMATICO ≈ 70 cents
Ne deriva che: • il tono piccolo (Tp) è la somma di un semitono diatonico e di un semitono cromatico, SD + Sc = 112 + 70 = 182 cents; • la somma di due semitoni cromatici (2·Sc) o di due semitoni diatonici (2·SD) non è un tono, 2·SD �= 2·Sc �= TG �= Tp; • il tono grande (TG) non può essere ridotto a somme di semitoni cromatici o diatonici. Convertendo gli intervalli della scala di giusta intonazione (e omettendo per ora 2m e 4�, prendendo in considerazione solo le note della scala maggiore e della minore naturali) in cents, otteniamo la sequenza di rapporti di tono e semitono di figura 6.1.
Figura 6.1: Giusta intonazione in cents
La scala maggiore e minore naturale sono definiti in musica come scale diatoniche. La definizione di scala diatonica è una scala formata da soli intervalli diatonici. Sono definiti intervalli diatonici i toni (grande e piccolo) e il semitono diatonico.
114
6.1 Giusta intonazione e temperamenti Studiando le possibili combinazioni, ne derivano solo due scale con le caratteristiche di scala diatonica date sopra (figura 6.2): la scala maggiore naturale e la scala minore naturale.
Figura 6.2: Scale diatoniche: scala maggiore naturale e minore naturale
In realtà esistono altre due possibilità: la scala minore melodica (1�2M�3m�4P�5P�6M�7M) e la scala misolidia �6 (1�2M�3M�4P�5P�6m�7m che, per chi ha conoscenze tecnicomusicali, è il V modo della minore melodica) che però non sono considerate diatoniche in senso stretto perché “mischiano” intervalli minori e maggiori nella stessa scala, mentre le due scale maggiore naturale e minore naturale contengono solo intervalli giusti e solamente maggiori oppure solamente minori (tranne la 2M, essendo costruita, come sappiamo, non in quanto intervallo maggiore ma in quanto quinta giusta della quinta giusta; è dunque un intervallo che potremmo impropriamente chiamare “giusto”). Secondo la teoria classica, il semitono cromatico (Sc ≈ 70 cents) è l’intervallo tra due note con lo stesso nome di cui una abbia subito un’alterazione (per esempio, C�C� oppure D��D) mentre il semitono diatonico (SD ≈ 112 cents) è l’intervallo tra due note contigue con nome diverso (per esempio, E�F, B�C, ma anche C�D�, C��D ecc.). Applicando questi principi all’ottava di giusta intonazione otteniamo un complicatissimo schema di intervalli (in cents e frazioni nella figura 6.3) valido per la sola scala di C.
115
6 Analisi del sistema a giusta intonazione
Figura 6.3: Giusta intonazione completa in tonalità di C
Dove: 25 24
Sc = Semitono cromatico (70.6724 approssimato a 70 cents)
16 15
SD = Semitono diatonico1 (111.7312 approssimato a 112)
10 9
Tp = Tono piccolo2 (182.4037 approssimato a 182 cents)
9 8
TG = Tono grande3 (203.91 approssimato a 204 cents)
Comprenderemo tra poco il significato degli altri intervalli. Per facilitare la lettura, indicheremo in grassetto le note naturali della scala di giusta intonazione. Notiamo che molti rapporti sono notevolmente complessi e che quelli più semplici sono appunto i rapporti della scala di giusta intonazione, i quali dunque avranno un IC basso e risulteranno più consonanti degli altri, che avendo un elevato 1 Che,
nella musica bizantina, corrispondeva al tono minimo. tono minore nella musica bizantina 3 Il tono maggiore nella musica bizantina 2 Il
116
6.1 Giusta intonazione e temperamenti numeratore e denominatore, avranno un IC più alto e saranno più dissonanti o, meglio, più complessi nei confronti della fondametale. Differente invece sarà se calcoliamo i rapporti tra ciascuna nota e le altre, cioè le proporzioni interne di ciascun intervallo. Per esempio, il A� da 225 128 è sicuramente complesso nei confronti del C, ma è in perfetta relazione di 45 5 225 terza maggiore 54 con il F� da 45 32 , infatti 32 4 = 128 . Anche il 125 B� da 64 , che è poco più stretto di un’ottava e dunque sicuramente complesso e dissonante nei contronti della tonica, è però in perfetta relazione di quinta giusta 32 con il E� da 125 96 , 125 3 = . Dunque, in un brano in scala di giusta infatti 125 96 2 64 intonazione, a seconda del preciso ruolo armonico di ciascuna nota sia nei confronti della tonica che nei confronti delle altre note con cui forma intervalli armonici, ogni nota dovrà essere scelta con cura e seguendo le regole esatte, altrimenti gli intervalli armonici che ne deriverebbero suonerebbero come stonati. Analizziamo innanzitutto il primo tono grande tra C e D. Notiamo la presenza di due C�, due D� e di altri nuovi intervalli. Il primo di cui parleremo è il Comma Sintonico, CS. Il C� di 25 24 , è ad un semitono cromatico Sc dal C, secondo la definizione data sopra di semitono cromatico (70 cents), mentre il C� di 135 128 è ad un semitono diatonico SD dal D, secondo la definizione di semitono diatonico vista sopra (112 cents). La differenza tra i due è di un comma sintonico (CS). La stessa analisi vale per il D� di 16 15 (la 2m della Scala di Giusta Intonazione) che dista un semitono diatonico dal C e per il D� di 27 25 che dista un semitono cromatico dal D. Tutto ciò comporta un nuovo semitono cromatico tra il C e il 16 9 C� di 135 128 e tra il D� di 15 e il D di 8 . Dunque chiameremo semitono cromatico piccolo (Sc) il semitono di 25 24 (70 cents) che è quello definito in teoria classica e semito-
117
6 Analisi del sistema a giusta intonazione no cromatico grande4 (SC) il semitono di 135 128 (92 cents) quale somma tra il semitono cromatico piccolo e il comma sintonico (Sc + CS = 70 + 22). Questi rapporti sono validi anche per il tono grande F�G e il tono grande A�B. Per i toni piccoli D�E e G�A i calcoli sono più semplici dato che, per esempio, il D� di 225 192 dista un semitono cromatico piccolo dal D e, contemporaneamente, un semitono diatonico dal E, rispettando le relative definizioni. Anche il E� di 65 (3m nella Scala di Giusta Intonazione) forma un intervallo di semitono diatonico con il D e di semitono cromatico piccolo con il E. Ad ogni modo, le due note D� e E� ovviamente non coincidono e differiscono per 42 cents (un intervallo formato da due intervalli più piccoli che analizzeremo tra poco). Nel semitono diatonico E�F, notiamo che il E� di 125 96 non corrisponde al F e che il F� di 32 non corrisponde al E. Que25 sto perché anche queste note devono sottostare alla definizione di semitono cromatico (E�E� e F��F). La stessa analisi è valida per il semitono diatonico B�C. Tutto ciò porta ad una ottava di ben 27 note, senza contare il fatto che questa è soltanto la scala di C. Se, per esempio, prendessimo la scala di D, il E (sua 2M) dovrebbe distare un tono grande dal D e sarebbe quindi più acuto di un comma sintonico rispetto al E quale 3M del C. Tutto questo per tutte le note di tutte e 12 le tonalità. Una giungla inestricabile. Molto più comodo (sebbene con qualche difetto di non poca importanza) è il temperamento equabile (oggi in uso) che 4 Corrispondente
118
all’apotome del tono minore nella musica bizantina
6.1 Giusta intonazione e temperamenti equipara tutti i semitoni a 100 cents, pari a 21/12 infatti � � 1 1 1200 · log2 2 /12 = 1200 · = 100 cents 12 Il temperamento uquabile crea i suoni omofoni (C� e D�, D� e E� ecc.) ed elimina le differenze tra tono grande e piccolo e tra semitono cromatico piccolo, cromatico grande e diatonico. Il prezzo da pagare è una non perfetta intonazione degli strumenti sulla tonalità e una lieve “increspatura” che si traduce in una percezione di ruvidità del suono e nei battimenti chiamati da mistuned consonances anche sulle consonanze perfette e imperfette. Dato l’ampio utilizzo moderno delle dissonanze forti, questa lieve “ruvidità” delle consonanze perfette e imperfette del temperamento equabile non ha praticamente alcun effetto sulla resa globale della riproduzione di un brano musicale, soprattutto se suonato da strumenti a corda che sono soggetti al fenomeno della inarmonicità. Quando una corda vibra, aumenta nel suo movimento sia la sua tensione che la sua lunghezza; queste differenze causano un’intonazione non precisa soprattuto degli armonici del suono prodotto. Se ascoltiamo però un’armonia suonata in giusta intonazione da strumenti che possono farlo e che per motivi fisici o matematici seguono maggiormente la teoria (come gli organi a canne oppure l’attuale musica elettronica) e la confrontiamo subito dopo con lo stesso brano in temperamento equabile, avremo una chiara percezione di cosa sia l’errore d’intonazione introdotto dal temperamento a gradi equalizzati. Oltre agli intervalli già visti, possiamo riconoscerne altri nella scala di giusta intonazione: • 19.5525 cents (C�135/128 �D�16/15 ; F�45/32 �G�64/45 ; A�225/128 �B�16/9 ) pari a 2048 2025 che chiameremo per comodità lim119
6 Analisi del sistema a giusta intonazione ma minimo (Lm)5 e che è pari al rapporto tra due note alterate di nome diverso, di cui la più grave dista un semitono diatonico dalla nota naturale successiva di nome diverso e la più acuta un semitono diatonico dalla nota naturale precedente di nome diverso; • 29.6135 cents (F�32/25 �E�125/96 ; C�48/25 �B�125/64 ) pari a 3125 3072 che chiameremo limma massimo (LM) che è pari al rapporto tra due note alterate di nome diverso di cui la più grave dista un semitono cromatico piccolo dalla nota naturale successiva con lo stesso nome e la più acuta dista un semitono cromatico piccolo dalla nota naturale precedente con lo stesso nome; • 41.0588 cents (C�25/24 �D�16/15 ; C�135/128 �D�27/25 ; D�225/192 �E�6/5 ; E5/4 �F�32/25 ; E�125/96 �F4/3 ; F�25/18 �G�64/45 ; F�45/32 �G�36/25 ; G�25/16 �A�8/5 ; A�125/72 �B�16/9 ; A�225/128 �B�9/5 ; B15/8 �C�48/25 ; B�125/64 �C2/1 ) pari a 128 125 che chiameremo comma composto (CC)6 in quanto uguale alla somma CS + Lm. Possiamo riassumenre tutti gli intervalli trovati nella tabella 6.1. Sappiamo inoltre che una scala minore è la relativa minore di una scala maggiore: la scala costruita a partire dalla 6M di una scala maggiore è la sua relativa minore (per esempio, A minore naturale e C maggiore naturale). Dunque, se partissimo dalla nota con rapporto 53 e proseguissimo lungo la scala maggiore, dovremmo ottenere una scala minore (scriveremo i primi due rapporti abbassati di una ottava, tabella 6.2). 5 Il 6 Il
120
diaschisma in musica antica grande diesis in musica antica
6.1 Giusta intonazione e temperamenti Intervallo
Sigla
Ratio
cts
Limma mimimo
Lm
2048 2025
19.55
Comma sintonico
CS
81 80
21.51
Limma massimo
LM
3125 3072
29.61
Comma composto
CC
128 125
41.06
CS+Lm
Semitono cromatico piccolo
Sc
25 24
70.67
CC+LM
Semitono cromatico grande
SC
135 128
92.18
Sc+CS
Semitono diatonico
SD
16 15
111.73
Sc+CC
Tono piccolo
Tp
10 9
182.40
SD+Sc
Tono grande
TG
9 8
203.91
Tp+CS
Tabella 6.1: Dal limma minimo al tono grande
Vediamo che invece non è esattamente così: la quarta giusta della relativa minore è decisamente crescente rispetto alla quarta giusta di giusta intonazione. Dunque avremmo bisogno di un’ulteriore rapporto 27 20 da inserire nel già complesso schema visto in precedenza. Il tentativo della definizione di una scala a giusta intonazione, inizia come sappiamo con Pitagora nel vi secolo a.C. L’idea inziale di Pitagora fu di sovrapporre dodici quinte giuste, riportando nell’ottava (se necessario) ogni suono generato, al fine di ottenere 12 note per ottava e un ultimo suono (il dodicesimo) che fosse il più possibile simile all’ottava e che avesse pertanto un rapporto con la prima nota generatrice il più possibile simile a 2. A parte la complessità dei rapporti
121
6 Analisi del sistema a giusta intonazione 6M
7M
1P
2M
3M
4P
5P
6M
1 1
9 8
6 5
27 20
3 2
8 5
9 5
2 1
5 6
1P
15 16
2M
1 1
3m
9 8
∼ 4P
5 4
5P
4 3
6m
3 2
7m
5 3
2P
Tabella 6.2: Scale relative in giusta intonazione
generati da questo sistema, l’ultima nota, che dovrebbe essere un’ottava sopra la fondamentale ed avere dunque rapporto 2, è lievemente più acuta superando di fatto l’ottava. Il loro rapporto può essere anche visto come il rapporto tra 12 quinte consecutive e 7 ottave ed esprime l’errore d’intonazione: � 3 �12 2
27
=
312 ≈ 1.01364326 219
che convertito in cents equivale a 23.46 cents ed è chiamato comma pitagorico. Nel iv secolo a.C. Archita formulò il primo sistema a rapporti matematici semplici (una prima bozza della scala di giusta intonazione) che fu perfezionato da Didimo nel i secolo a.C. e da Tolomeo nel ii secolo d.C. Venne ultimato e completato definitivamente nel 1558 (nella forma che abbiamo visto) dal teorico Gioseffo Zarlino. Risolto il problema del comma pitagorico, dell’ottava “sbagliata” e della complessità dei rapporti, si presentava però il problema del comma sintonico detto anche comma di Didimo, che può anche essere visto come il rapporto tra 4 quinte consecutive e il V armonico � 3 �4 34 81 2 = 4 = 5 2 ·5 80 122
6.1 Giusta intonazione e temperamenti e che, come possiamo facilmente immaginare, rendeva molto difficoltosa l’accordatura degli strumenti e la modulazione in altre tonalità all’interno dello stesso brano musicale. Il problema del comma sintonico e della differenza d’intonazione tra le varie tonalità maggiori e minori, diede origine a decine di temperamenti, costituiti da una serie di rapporti più o meno artificiosi che rendessero meno difficoltosa l’accordatura degli strumenti senza “snaturare” troppo i rapporti semplici (e dunque la consonanza o meglio la sintonia degli intervalli) della scala di Didimo e Zarlino. Nella seconda metà del 1500 fu il matematico olandese Simon Stevin (e non Andreas Werckmeister) che, nel suo trattato Vande spiegheling der singconst, ipotizzò per primo (in occidente) il sistema a temperamento equabile che risolveva molti problemi pratici e teorici ma che, come abbiamo visto, produceva rilevanti errori d’intonazione su alcuni intervalli ritenuti al tempo “troppo importanti” (come la 3M). D’altra parte nel 1584, il principe cinese Chu Tsai-Yü aveva già elaborato (prima di Stevin) il calcolo per il temperamento equalizzato a 12 toni uguali. Lo scritto di Andreas Werckmeister, a cui erroneamente si attribuisce la scoperta e la promulgazione del temperamento equabile, risale ad oltre un secolo più tardi, per la precisione nel 1691. Nel suo Über die Musikalische Temperatur, Werckmeister, tra l’altro, nemmeno si pronunciava a favore del temperamento equabile, ma proponeva altri 4 temperamenti completamente diversi, e decisamente più accettabili dal punto di vista armonico. Il temperamento equabile non fu accettato di buon grado da nessuno dei grandi compositori, maestri e teorici (nemmeno da Bach), i quali preferivano di gran lunga i temperamenti di Kirnberger e Werckmeister, che fino alla metà del 1800 venivano considerati i migliori ed erano sicuramente i più diffusi. Johan Sebastian Bach
123
6 Analisi del sistema a giusta intonazione stesso molto probabilmente utilizzava un temperamento di propria formulazione, come dimostrerebbero gli interssanti studi del ricercatore e musicista Bradley Lehman. Sarà solo dalla seconda metà del 1800 che, per opera soprattutto dei Maestri pianisti e dei Mastri liutai, il temperamento equabile guadagnerà sempre più terreno rispetto agli altri. Come possiamo notare dalla tabella 6.3 però, il temperamento equabile (ste) è causa di errori di intonazione su tutti gli intervalli rispetto a quelli della scala di giusta intonazione (sgi).
Tabella 6.3: Errori del temperamento equabile (sgi = ratio in giusta intonazione; ste = ratio in temperamento equabile; ∆cts = differenza in cents)
Tutti i temperamenti ovviamente producono errori d’intonazione, ma quelli creati ad hoc (i temperamenti di Kirnberger, Werckmeister ecc.) sono più parsimoniosi per quegli intervalli più importanti (come le terze e le consonanze perfette) mentre il temperamento equabile è (dal punto di vista matematico) una brutale forzatura dei semitoni a 100 cents, che non tiene conto del ruolo di ciascun intervallo e/o della sua condizione di consonanza o dissonanza, ma li equalizza tutti. Dato il potere di discriminazione dell’orecchio umano, errori minori di 5 cents si possono considerare trascurabili (in intervalli melodici)7 . La 2m, la 4�, la 6m, la 7m e 7M, 7 Infatti,
come detto, il nostro potere di discriminazione per le frequenze dei suoni musicali è, ottimisticamente, attorno allo 0.2-0.25%, il che significa che è possibile discriminare frequenze con ratio 1.002-1.0025 che equivale a circa 3.5-4.3 cents
124
6.1 Giusta intonazione e temperamenti essendo comunque intervalli dissonanti, non risentono molto degli errori di intonazione del ste sebbene decisamente maggiori di 5 cents. Ma le consonanze imperfette 3m e 3M e la dissonanza debole 6M, sono decisamente più sensibili agli errori di intonazione (soprattutto in intervalli armonici), essendo oltretutto di somma importanza nella formazione degli accordi e dunque dell’armonia musicale stessa. Infatti notiamo che la 3m del ste è, arrotondando all’unità, 16 cents più stretta che nel sgi, la 3M del ste è 14 cents più larga e la 6M del ste è 16 cents più larga di quella del sgi. Essendo inoltre i semitoni del ste tutti uguali, questi errori di intonazione si ripercuotono su tutte e 12 le tonalità. Questo crea anche battimenti dissonanti in un accordo detti fenomeni da mistuned consonances che affronteremo nei prossimi capitoli. Anticamente inoltre, gli intervalli di terza avevano anche una valenza di tipo religioso, essendo considerati una delle espressioni della trinità divina. Nella musica moderna d’altra parte, essendo le dissonanze utilizzate con meno rigore e più facilità che nella musica classica ed essendo ormai integrata con elementi musicali provenienti da altre culture (come nel blues, nel jazz, nel rock e in tutti i loro derivati) che si fondano su princìpi diversi da quelli di consonanza e dissonanza della scala di giusta intonazione, gli errori di intonazione introdotti dal temperamento equabile sono sovente trascurabili. Ciononostante, per quanto riguarda la musica classica e in special modo la musica antica e barocca, il temperamento a gradi equalizzati rimane fondamentalmente un’intonazione “innaturale” a rapporti complessi, e la scala di Zarlino e i temperamenti non equabili (come quello di Kirnberger e Werckmeister) sono ancora oggi ritenuti i migliori. Lo stesso Oskar Walcker (costruttore di organi) scrisse in una lettera
125
6 Analisi del sistema a giusta intonazione nel 1942 «Ho tuttora un organino accordato in base all’intonazione naturale, in verità soltanto con un registro a disposizione, eppure non finisco di meravigliarmi di come sia stupendamente chiara e sostenuta l’accordatura giusta». Inoltre la recente introduzione della musica elettronica in tutti i generi musicali, dalla classica al jazz all’avanguardia ecc., riporta a galla tutti i problemi derivati da un errato temperamento ma anche possibilità espressive attraverso l’utilizzo artistico proprio dell’errore d’intonazione. Un’ultima curiosità storica: avvenne nella convenzione internazionale del 1939 che fu deciso che la frequenza del A centrale (il A4 ) dovesse essere uguale per tutti e pari a 440 Hz; prima di questa convenzione il A4 (e dunque l’accordatura di tutta l’orchestra che si basa sul A4 dato dal pianoforte o dal primo violino) poteva fluttuare di all’incirca ±5 Hz attorno ai 4408 , se non di più, a discrezione del direttore d’orchestra9 .
6.2 Altre scale “giuste” Nel corso della storia, e soprattutto nel xx secolo, sono state create altre scale giuste chiamate solitamente super giuste. Sono scale che oltre ai rapporti semplici della scala di giusta intonazione utilizzano anche rapporti più complessi e sono state create più che altro a scopo artistico, come la scala a 43 note (in un’ottava) di Harry Partch o la scala giusta a 12 8A
440 Hz, differenze di 1 Hz equivalgono a circa 4 cents, corrispondenti 0.22% di differenza, dunque sono perfettamente discriminabili 9 Ancora oggi alcune orchestre accordano a poco più di 440 Hz per avere un suono più brillante.
126
6.2 Altre scale “giuste” toni (scala cinese Lu) creata da Huai-nan-dsi della dinastia Han o la Lou Harrison scale di 16 note. Molto interessante è la scala a 24 toni di Michael Harrison (molto simile alla scala a 27 note che abbiamo presentato poco fa) che utilizzò negli anni ’80 del xx secolo, per accordare un pianoforte modificato: tramite la pressione di un pedale, il musicista poteva modulare in altre tonalità mantenendo i rapporti di giusta intonazione (sgi) per molte tonalità, infatti ogni tasto del pianoforte poteva suonare tre corde accordate in modo differente e cambiare corda grazie alla pressione di un pedale apposito. Anche Bosanquet nel 1867 costruì un Harmonium (una sorta di piccolo organo) sulla base di una scala di ben 53 note formata da cinque toni interi divisi in nove parti e due semitoni divisi in quattro parti, 5 · 9 + 2 · 4 = 53. Molte delle note di questo harmonium risultavano ben temperate rispetto alla scala di giusta intonazione, sebbene un’ottava dovesse contenere 53 tasti anziché i 12 del sistema a temperamento equabile (e di tutti gli altri temperamenti che non aggiungevano note). Altri temperamenti equabili a più di 12 note sono stati proposti nel corso della storia, come il temperamento a 19 note di Christiaan Huygens (xvii secolo) o il temperamento a 31 note di Nicola Vicentino (xvi secolo), utilizzato poi nel ‘900 da Adriaan Daniel Fokker, fisico e musicista, per il suo harmonium Thirty-one-toned Organ. Più antica è invece la scala indiana Sruti formata da 22 note (tabella 6.4), con numeratori e denominatori (e dunque IC ) decisamente più elevati rispetto alla scala di giusta intonazione occidentale. Nonostante la notevole complessità di alcuni rapporti ne notiamo però alcuni ben noti: l’ottava, la quinta giusta, la quarta giusta, le due terze, le due settime ed entrambe le seste e le seconde, più la quarta aumentata. Ecco cosa intende-
127
6 Analisi del sistema a giusta intonazione 1 1
256 243
16 15
10 9
9 8
32 27
6 5
5 4
81 64
4 3
27 20
45 32
759 542
3 2
128 81
8 5
5 3
27 16
16 9
9 5
15 9
243 128
2 1
Tabella 6.4: Scala indiana Sruti
vamo quanto parlavamo di “universalità” di alcuni rapporti: questi rapporti semplici hanno proprietà fisiche e matematiche che evidentemente sono state riconosciute (e dunque usate) da tutte le culture che abbiano indagato le possibilità dei suoni armonici. In sostanza, la scala Sruti contiene tutta la scala di giusta intonazione più altre 10 note. A differenza però della scala a 27 note che abbiamo presentato qualche pagina fa, la quale era semplicemente una analisi matematica della scala di giusta intonazione (di 12 note, anzi, di sole 7 note per la scala maggiore e 7 per la scala minore) per dimostrare la differenza tra i toni e semitoni della scala stessa, la scala Sruti non è un estrapolazione matematica di una scala più semplice: è usata esattamente in questo modo, con 22 note per ottava. La differenza in quantità (e complessità di rapporti) delle note delle due scale è un chiaro indice della differente specializzazione musicale delle due culture: la cultura indiana ha approfondito i concetti e le possibilità melodiche della musica mentre in occidente è stato appronfondito l’aspetto armonico. Dunque in occidente c’è stato bisogno di una scala con meno note e con rapporti semplici in modo che fossero il più possibile consonanti tra loro negli accordi, mentre in India è stata creata una scala che offrisse maggiori possibilità melodiche. Un ascoltatore occidentale difficilmente riuscirà a precepire la complessità melodica di una musica indiana, ma
128
6.2 Altre scale “giuste” la troverà povera di movimento armonico (infatti spesso vengono usati uno o due accordi, drones, in tutto il brano). Un ascoltatore indiano percepirà con più difficoltà la complessità armonica di un brano occidentale e sentirà evidente una povertà melodica, infatti sarà composto da sole sette note (o poco più) invece di ventidue o più. Allo stesso modo, un ascoltatore africano percepirà la musica occidentale come povera di ritmo e un ascoltatore occidentale non riuscirà a comprendere la complessità ritmica e metrica di un brano africano. Non tutte le culture infatti si sono dedicate ai suoni armonici: alcune hanno studiato gli aspetti ritmici e metrici del suono (come l’Africa) o gli aspetti timbrici (come i Nativi Americani e gli Indigeni Australiani) o gli aspetti descrittivi interiori o esteriori (come in Cina e Giappone). Dunque, non in tutte le culture è stato importante avere una scala di riferimento. In Africa infatti, le accordature utilizzate per la kora (una sorta di arpa, strumento tradizionale soprattutto della zona del Sael) differiscono da tribù a tribù e le note cantate sono dette a “intonazione variabile” perché non hanno un rapporto costante con la fondamentale. Queste note, che a prima vista possono sembrare così lontane dalla nostra cultura, sono le stesse che oggi siamo abituati a sentire in tutti quei brani che hanno una componente storica africana: sono le blue notes del blues. Di fatto, i primi compositori e musicisti che sentirono i canti popolari africani (nei campi da lavoro dei deportati africani in America) giudicarono come stonate le loro melodie, senza accorgersi (non ancora almeno) della possibilità di integrazione tra le due culture. La successiva fusione degli aspetti ritmici, metrici e d’intonazione variabile dell’Africa e di quelli armonici (e in parte melodici) della cultura occidentale han-
129
6 Analisi del sistema a giusta intonazione no dato origine al blues, al jazz e poi a molte altre forme di ibridazione, alcune delle quali inconsapevoli (il contributo africano è riconoscibile anche nell’hard rock, nell’heavy metal, nella pop-music e in altre forme, i cui autori non sempre sono consapevoli dell’origine storica dei materiali sonori a cui attingono).
6.3 Intervalli storici Riportiamo qui di seguito, per riassunto e curiosità, alcuni degli intervalli storici più importanti ordinati dal più piccolo al più grande. Ratio 1/1 21/1200 32805/32768 2048/2025 81/80 312/219 64/63 3125/3072 128/125 25/24 256/243 135/128 21/12 16/15 2187/2048 10/9
130
Nota C
D�
Intervallo Unisono perfetto 1 cent Schisma Diaschisma (Lm) Comma sintonico (CS) Comma pitagorico Comma settimale Limma massimo (LM) Grande diesis (CC) Semitono cromatico piccolo (Sc) Diesis limma Apotome del tono minore (SC) Semitono equalizzato Seconda minore (SD) Apotome pitagorico Tono piccolo (Tp)
6.3 Intervalli storici 21/6 9/8 7/6 32/27 21/4 6/5 5/4 21/3 81/64 4/3 25/12 7/5 45/32 21/2 64/45 729/512 27/12 3/2 128/81 22/3 8/5 13/8 5/3 23/4 27/16 7/4 16/9 25/6 9/5 15/8 211/12
D
E� E F F� G� G A� A
B� B
Tono equalizzato Seconda maggiore (TG) Tono supermaggiore Terza minore pitagorica Terza minore equalizzata Terza minore Terza maggiore Terza maggiore equalizzata Terza maggiore pitagorica Quarta giusta Quarta giusta equalizzata Tritono settimale Quarta aumentata Tritono equalizzato Quinta diminuita Tritono pitagorico Quinta equalizzata Quinta giusta Sesta minore pitagorica Sesta minore equalizzata Sesta minore Tredicesimo armonico Sesta maggiore Sesta maggiore equalizzata Sesta maggiore pitagorica Settimo armonico Settima minore pitagorica Settima minore equalizzata Settima minore Settima maggiore Settima maggiore equalizzata
131
6 Analisi del sistema a giusta intonazione 243/128
2
132
C
Settima maggiore pitagorica Ottava perfetta
7 Le consonanze stonate fenomeno dei battimenti da «consonanze stonate», bcs Inell(mistuned consonances, termine introdotto da Bosanquet 1881), è strettamente imparentato col fenomeno dei bat-
timenti primari, ma si verifica per frequenze la cui differenza sia superiore alla banda critica, e consiste in una regolare modulazione in ampiezza dell’inviluppo secondario dell’onda risultante, che appunto viene percepito come battimento, anche se meno accentuato del battimento primario. È attualmente annoverato tra gli effetti percettivi di II ordine dovuti dunque alla elaborazione del segnale da parte del sistema nervoso.
Figura 7.1: Battimento da consonanza stonata
133
7 Le consonanze stonate
7.1 Cenni storici e motivazioni Il fenomeno dei battimenti è stato studiato sotto diversi punti di vista nell’arco della storia. Vengono chiamati battimenti primari quelle modulazioni in ampiezza (percepite come “oscillazioni del volume”) che sono il risultato del fenomeno fisico dell’interferenza tra due o più onde che differiscono tra loro di pochi Hz (meno di 20) e di cui sono stati riconosciuti patterns di vibrazione nelle strutture dell’orecchio interno. Sono dunque considerati effetti di I ordine. Vi sono però dei battimenti, altrettanto udibili, che avvengono per frequenze più distanti e che sono appunto chiamati mistuned consonances perché si ottengono quando si stona, aggiungendo o sottraendo un errore di pochi Hz, una consonanza costituita quindi da due frequenze il cui rapporto può essere descritto da un rapporto frazionario semplice (basso IC , come abbiamo visto) cioè proprio le consonanze del sistema a giusta intonazione. Di questi battimenti, non sono state riscontrate vibrazioni corrispondenti nella coclea o in altri parti dell’orecchio interno, ma si registrano pattern di attivazione neurale nella corteccia uditiva. Si ritiene dunque che siano effetti di II ordine, causati dall’elaborazione del segnale da parte del sistema nervoso ma che non siano direttamente “tradotti” dall’orecchio interno. Ciononostante, i battimenti da consonanze stonate hanno un preciso corrispettivo fisico e matematico nell’onda somma che rappresenta lo stimolo originario. Non sono dunque pure illusioni create dal sistema nervoso ma una caratteristica intrinseca dei fenomeni ondulatori, che potrebbero anche ripercuotersi sulle strutture dell’orecchio interno, ma in maniera tanto meno evidente rispetto ai battimenti primari da non poter essere rilevata con gli attuali strumenti tecnici di misura.
134
7.1 Cenni storici e motivazioni Storicamente, il primo tentativo di spiegazione del fenomeno, fu fatto nel 1628 dallo scienziato tedesco Beeckman, che però ne diede una descrizione errata. Nel 1636, Mersenne approfondì gli studi e corresse gli errori descrittivi di Beeckman, ma la sua spiegazione del fenomeno poteva applicarsi solo a suoni complessi, non invece a toni puri, che possono però altrettanto provocare battimenti da consonanze stonate (bcs). Circa 200 anni dopo, Scheibler tentò una prima analisi sui toni puri, ma non riuscì a fornire una spiegazione valida per tutti i casi noti. Solo nel 1839, Ohm dedusse una formula, valida ancora oggi, che descrive efficacemente tutti casi noti di battimenti da mistuned consonances tra due toni puri. Dati due toni puri di frequenza ν1 e ν2 , il cui rapporto sia di poco differente da N1 /N2 (dove N1 ed N2 sono numeri naturali), la frequenza del battimento che genereranno sarà ν2 N1 − ν1 N2 : se poniamo ν1 = N1 x e ν2 = N2 x + ε avremo un battimento pari a N1 ε. Ohm spiegò questi risultati sulla base di interazioni tra i suoni di combinazione, i prodotti di intermodulazione della coclea umana, causati dalla sua distorsione non-lineare ad alti volumi. Altri li attribuirono ad interferenze tra gli aural harmonics (armoniche auricolari), gli armonici generati dall’orecchio interno, anch’essi dovuti a distorsioni non lineari dei nostri sistemi percettivi. Successivi studi smentirono però entrambe queste ipotesi, dimostrando che i bcs sono udibili anche a volumi non abbastanza elevati da produrre distorsione e dunque suoni di combinazione e che, mascherando gli aural harmonics con diversi espedienti, la percezione dei bcs era comunque conservata. Una terza ipotesi però, si affacciò fin dal 1864, quando De Morgan per primo riuscì a provare che la frequenza dei bcs era in accordo con le leggi fisiche dell’interferenza tra onde armoniche. Successivamente, nonostante l’ipotesi della distorsione non
135
7 Le consonanze stonate lineare fosse comunque la più comunemente accettata, diversi ricercatori tentarono di fornire una spiegazione matematica e fisica del fenomeno che non comprendesse effetti distorsivi dell’orecchio interno. Anche il fenomeno dei bcs in accordi di tre toni venne studiato fin dalla prima metà del 1800; solo nel 1902 ter Kuile riuscì a dimostrare che la frequenza dei bcs in questi casi era legata alla forma (inviluppo) dell’onda risultante. Questo studio rese ancor più probabile la possibilità che anche i bcs per due toni fossero dovuti ad un evento fisico e non a distorsioni non lineari dei nostri apparati percettivi. Ad’oggi la questione sui bcs è ancora aperta e numerosi studi sono ancora in atto per comprendere quali siano le nostre strutture (anatomiche e/o neurali) che ne rendano possibile la percezione. Rimane comunque indubitabile il fatto che i bcs sono una proprietà fisica e matematica delle onde dovuta a semplici fenomeni d’interferenza: alcuni di essi sono chiaramente percepibili altri meno chiaramente, esattamente come quelli che chiamiamo battimenti primari che entro determinati limiti (non più di 20 Hz) possono essere percepiti dall’udito umano. È proprio di questo che ci occuperemo, illustrando un sistema matematico semplice in grado di spiegare e prevedere le frequenze dei battimenti primari da consonanze stonate. Prima di iniziare, vorremmo però sottolineare l’importanza di questi studi nell’attuale panorama musicale moderno. Abbiamo infatti accennato al fatto che per gli strumenti a corda, a causa della inarmonicità delle corde, la teoria non può essere applicabile alla lettera, cosa che invece era (ed è ancora) valida per gli organi a canne. Ciononostante, la recente introduzione della musica elettronica in moltissimi generi musicali, dalla classica al jazz, dal pop alla musica d’avanguardia, risolleva il problema della esatta descrizione matematica dei
136
7.1 Cenni storici e motivazioni fenomeni acustici, sia per il fatto che i suoni generati elettronicamente seguono la teoria molto più dei suoni generati da strumenti acustici, sia per il fatto che per generare suoni elettronici è necessario fornire al calcolatore una serie di istruzioni la cui base è fondamentalmente matematica, dunque sono il corrispettivo matematico di formule, funzioni ed algoritmi. Questa affermazione è confermata dalle interessanti opere di Jean-Claude Risset, compositore e ricercatore, prosecutore degli studi di Roger Shepard riguardanti le illusioni acustiche mediante modulazione di frequenza (cfr. Shepard-Risset glissando). Infatti per ciascuno di questi fenomeni esistono diverse possibili applicazioni in musica elettronica efficacemente utilizzabili a scopo artistico, creativo e comunicativo. Questo in accordo con il monito di Aristosseno, allievo di Pitagora, che giustamente incitava a non dimenticare, tra formule e calcoli, che la ragion d’essere della musica risiede nell’orecchio dell’ascoltatore piuttosto che in riflessioni matematiche. Non ci sofferemo in questa sede sulla quantificazione dell’udibilità dei fenomeni descritti, ma daremo semplicemente una descrizione matematica delle interazioni tra onde armoniche relativamente ai bcs, utilizzabili anche come materiale sonoro a scopo artistico. Vorremmo anche sottolineare che, a differenza dei battimenti primari e di frequenze in banda critica, i bcs non sono necessariamente percepiti come sgradevoli, anzi conferiscono una certa vivacità all’intervallo armonico. Vengono infatti descritti in svariati modi, come variazioni nel timbro, nell’intesità del suono più grave o del tono più acuto. La prima descrizione è forse la più interessante. Sappiamo infatti che il timbro è strettamente correlato all’inviluppo, ed è proprio l’inviluppo dell’onda che subisce variazioni nei bcs.
137
7 Le consonanze stonate
7.2 I battimenti primari Iniziamo dunque l’analisi dei bcs per due frequenze pure, rivedendo più in dettaglio i battimenti primari. Siano pertanto date due frequenze pure ν1 e ν2 tali per cui ν2 ≤ 2ν1 (+20) Analizzeremo dunque due suoni puri (quindi senza armonici) in rapporto massimo di ottava più un errore massimo di 20 Hz. Dati i numeri con cui avremo a che fare, per gli esempi sceglieremo di volta in volta frequenze comode, abbastanza elevate da non creare battimenti primari con le consonanze imperfette (3m e 3M) e che siano divisibili per i denominatori delle consonanze propriamente dette, perfette e imperfette, che analizzeremo. Sappiamo che se la differenza tra le frequenze di due suoni è minore di 20 Hz, sentiremo un battimento primario pari a ν2 − ν1 . Questo risultato deriva dall’interferenza semplice tra le due frequenze. Se analizziamo la questione dal punto di vista dei periodi, la distanza temporale tra le creste di un onda, possiamo meglio comprendere cosa accade. Indicheremo con T1 e T2 i periodi, in secondi, delle due frequenze. T1 =
1 ν1
T2 =
1 ν2
Il periodo T di una frequenza ν è pari al reciproco della frequenza. Di fatto, la frequenza in Hz esprime proprio il numero di periodi in un secondo.
138
7.2 I battimenti primari La maggiore consonanza che conosciamo è la consonanza di unisono perfetto, costituita da due suoni con medesima frequenza e dunque medesimo periodo. Per semplicità di calcolo, porremo ν1 = ν2 = 100 Hz Il periodo di queste due frequenze sarà quindi T1 = T2 = 1/100 = 0.01 secondi (sec) Abbiamo bisogno di un aiuto grafico per comprendere meglio il problema. Dunque, esprimeremo le equazioni delle due onde in funzione del tempo: ψ1 = A sin(2πν1 t + φ) ψ2 = A sin(2πν2 t + φ) ψsum = ψ1 + ψ2 Dove ψ1 e ψ2 sono le equazioni delle due onde singole e ψsum è l’equazione della somma delle due onde e del suono effettivamente udibile e registrabile. A è l’ampiezza dell’oscillazione delle onde. Per facilità di calcolo, la porremo inizialmente uguale a 1. φ è la fase dell’onda e indica il “punto di partenza” dell’onda: può essere compresa tra 0 e 2π. La massima oscillazione dell’onda dipende dalla sua ampiezza A: avendola posta uguale a 1, le due onde singole oscilleranno da +1 a −1. Ponendo la fase φ = 0 le due onde partirebbero in fase da zero, all’istante t = 0. Per motivi grafici e per semplicità di calcolo, porremo inizialmente la fase uguale a π 2 in modo tale che le due onde partano in fase da +1, all’istante t = 0. Chiameremo νβ la frequenza del battimento, sia primario che da consonanza stonata (bcs).
139
7 Le consonanze stonate In questo caso, t è il tempo e lo leggeremo dunque sull’asse delle ascisse, mentre ψ è l’onda del moto oscillatorio e ne leggeremo l’intensità sull’asse delle ordinate1 . Prendiamo dunque 10 periodi di T1 e T2 : 0.01 · 10 = 0.1 sec, e vediamo cosa succede (fig. 7.2).
Figura 7.2: ν1 = ν2 = 100 Hz
Le due onde ψ1 e ψ2 sono perfettamente in fase, tanto da essere indistinguibili e la loro somma è, in frequenza, esattamente uguale a quella delle sue componenti. Tutti i periodi coincidono perfettamente. L’ampiezza dell’onda risultante è esattamente sempre la somma delle ampiezze delle componenti. In questo caso dunque l’oscillazione massima sarà 2A. Se ora introduciamo un errore ε su ν2 , per esempio di +3 Hz, osserveremo che il suo periodo cambia di conseguenza e dunque avremo T2 = 1/ν2 = 1/103 ≈ 0.0097 1 Nei
grafici sono stati aggiunti dei coefficienti per porre le onde a distanze differenti dall’asse x e non averle sovrapposte.
140
7.2 I battimenti primari Vediamo infatti che le due onde si sfasano progressivamente (fig. 7.3 superiore). Osserviamo cosa succede su un intero secondo (fig. 7.3 inferiore).
Figura 7.3: ν1 = 100 e ν2 = 103 Hz
Quello che vediamo in basso è una modulazione d’ampiezza tra frequenze vicine, quindi una modulazione in ampiezza dell’onda risultante ψsum dovuta allo sfasamento progressivo delle due onde componenti (che sarà percepito come battimento primario). Quando i picchi delle onde componenti tornano in fase o in quasi-fase (vedi oltre) l’ampiezza del-
141
7 Le consonanze stonate l’onda risultante si avvicina al picco massimo di 2, quando invece le due onde sono in opposizione di fase (una è a −1 e l’altra a +1) l’onda risultante è a zero. Queste due situazioni vengono denominate rispettivamente interferenza costruttiva e interferenza distruttiva. Nel battimento primario, si alternano interferenza costruttiva e distruttiva ogni 1/ |ε| secondi. La modulazione d’ampiezza, e quindi anche il battimento primario, è esattamente uguale al modulo dell’errore introdotto |ε| = |ν2 –ν1 | ed è descritta dalla curva di inviluppo (Esum , Envelope), che è una curva contemporaneamente tangente a tutti i picchi dell’onda di cui descrive il profilo. Abbiamo aggiunto un coefficiente grafico nelle immagini, perché quando l’analisi si complicherà, avremo bisogno di distinguere chiaramente Esum da ψsum . Per motivi che saranno chiari tra poco chiameremo larghezza di banda (bw, band width) la differenza tra le due frequenze componente ν1 e ν2 ; avremo dunque una frequenza della larghezza di banda: νBW = ν2 − ν1 L’equazione dell’onda di inviluppo (l’onda E in fig. 7.3), dipende direttamente dalla frequenza della larghezza di banda (bw). Esprimiamo quindi l’equazione dell’onda di inviluppo in funzione del tempo t e di νBW Esum = |2A cos(πνBW t)|
In questo caso dunque:
νβ = |νBW | = |ν2 − ν1 | = |ε|
Abbiamo posto il valore assoluto all’equazione che descrive l’inviluppo Esum , dato che possiamo interessarci solamente
142
7.2 I battimenti primari dei picchi positivi, perché essendo queste onde periodiche ed armoniche, l’inviluppo inferiore è sostanzialmente uguale all’inviluppo superiore (solo l’inviluppo, non la configurazione dei picchi singoli). Vediamo dunque che, nel battimento primario per frequenze vicine, causato da un errore sull’intervallo di unisono, l’onda di inviluppo descrive perfettamente il profilo dell’onda somma e che la sua frequenza è pari alla frequenza del battimento. La funzione coseno dell’inviluppo primario è stata posta, come detto, in valore assoluto. Questo determina una rettificazione a doppia semionda positiva della funzione coseno. Dato l’ampio uso che faremo della rettificazione a doppia semionda, positiva e negativa, approfondiamo il concetto. La rettificazione è un espediente utilizzato in diverse discipline ma, soprattutto, in elettronica. Il rettificatore trasforma un’onda ψ, che può assumere valori positivi e negativi, in valori tutti positivi o tutti negativi, a seconda dell’utilizzo. Esistono quattro tipi di rettificazione (figura 7.4): 1. Rettificazione a singola semionda positiva. In questo tipo, vengono contemplati solamente i valori positivi dell’onda ψ. Dal punto di vista matematico, equivale all’operazione ψ1/2R+ = 12 |ψ| + 12 ψ . In questo modo quando ψ è positiva ψ1/2R+ = ψ , mentre quando ψ è negativa ψ1/2R+ = 0. 2. Rettificazione a singola semionda negativa. È l’esatto opposto della precedente: vengono contemplati solo i valori negativi di ψ. Equivale a ψ1/2R− = 12 ψ − 12 |ψ|. Quando ψ è positiva ψ1/2R− = 0 quando ψ è negativa ψ1/2R− = ψ.
143
7 Le consonanze stonate 3. Rettificazione a doppia semionda positiva. In questo caso vengono contemplati tutti i valori di ψ ma anche i valori negativi vengono resi positivi. Matematicamente equivale a ψR+ = |ψ|. Quando ψ è positiva ψR+ = ψ e quando è negativa ψR+ = −ψ. 4. Rettificazione a doppia semionda negativa. È l’opposto della precedente: tutti i valori di ψ sono contemplati ma i valori positivi sono resi negativi. Equivale a ψR− = − |ψ|. Quando ψ è positiva ψR− = −ψ e quando è negativa ψR− = ψ.
Figura 7.4: Rettificazione
Data la forma dell’inviluppo superiore e inferiore dell’onda somma nei bcs, utilizzeremo onde rettificate a doppia semionda positiva per l’inviluppo superiore e rettificate a doppia semionda negativa per l’inviluppo inferiore. Notiamo anche che la periodicità di onde sinusoidali semplici (come quella in figura 7.4) rettificate a semionda singola è sempre 2π, mentre per quelle rettificate a doppia semionda è la metà essendo periodiche per π (come le onde che descrivono i bcs).
144
7.2 I battimenti primari Prima di procedere, notiamo un’altra caratteristica molto interessante dell’onda somma nel battimento primario.
Figura 7.5: ν1 = 100 e ν2 = 110 Hz
In Figura 7.5, l’onda somma è quella più scura e le due onde più chiare sono le componenti. In questo caso abbiamo posto ν1 = 100 Hz e ν2 = 110 Hz. È chiaramente visibile che i picchi dell’onda somma sono esattamente a metà tra quelli di ν1 e di ν2 ; la frequenza dell’onda somma è pari a (ν1 + ν2 ) /2 = 105 Hz che è proprio la frequenza unitaria che viene percepita secondo i risultati degli studi di psicoacustica (riprenderemo alla fine del capitolo questa caratteristica con un esperimento). Dunque troviamo una relazione fisica e matematica ad un fatto percettivo. Un ulteriore approfondimento utile è intorno al concetto di quasi-fase. Poniamo le fasi delle due onde componente pari a φ = 0 . In questo modo, all’istante t = 0 le due onde saranno in fase a 0 e non più a +1. Dunque l’onda somma, in t = 0 avrà valore ψsum = sin 0 + sin 0 = 0, mentre se la fase delle due onde fosse φ = π2 in t = 0 avremmo ψsum = sin π2 + sin π2 = 2. Per la fase φ = π2 le due onde
145
7 Le consonanze stonate partono in fase +1 e dunque l’onda somma è al suo massimo assoluto. Per la fase φ = 0 le due onde partono in fase a 0 e dunque l’onda somma raggiungerà il suo picco massimo ad un determinato tempo tmax . Osserviamo l’onda somma entro 1 secondo da t = 0 a t = 1, per due frequenze ν1 = 50 Hz e ν2 = 49 Hz, e quindi ε = −1 Hz (figura 7.6).
Figura 7.6: Battimento primario di 1 Hz
Notiamo chiaramente il battimento primario di 1 Hz. Nonostante le due onde non partano in fase a +1 in t = 0, l’inviluppo primario si “contrae” fino allo zero (interferenza distruttiva) per t = 0.5 secondi e l’ampiezza dell’onda somma è massima (interferenza costruttiva) per t ≈ 0 e t ≈ 1. In questo caso però, le onde componente non sono in opposizione di fase in t = 0.5 ma sono in fase a zero. Infatti, ponendo t = 0.5 otteniamo ψsum = sin (2π50 · 0.5) + sin (2π49 · 0.5) = sin 50π + sin 49π
Essendo la funzione seno periodica per 2π, qualunque angolo pari ad n2π + α ≡ α. Quindi possiamo scrivere: ψsum = sin (25 · 2π) + sin (24 · 2π + π) = sin 0 + sin π = 0
146
7.3 I BCS nelle consonanze Scendiamo ora più nel particolare e osserviamo i picchi massimi locali tra t = 0 e t = 0.1 secondi e aggiungiamo al grafico le derivate prime dell’onda somma e delle onde componente. Le derivate prime indicano in questo caso i punti di massimo e minimo locale delle onde (figura 7.7 superiore). Notiamo, come prevedibile, che i picchi delle due onde componente si “sfasano” progressivamente. Il primo picco massimo, rappresenta il massimo assoluto e potrebbe sembrare che i picchi delle due onde siano perfettamente coincidenti in fase, me se scendiamo ancora più nel particolare ad analizzare il primo picco, tra t = 0 e t = 0.01 secondi (figura 7.7 inferiore) troviamo che le due onde non sono perfettamente in fase. Questa situazione è chiamata quasi-fase. Nel nostro caso (per i battimenti primari e successivamente anche per i bcs) è una situazione in cui, per fasi delle due onde diverse da π2 , il picco massimo assoluto dell’onda somma viene raggiunto per un tmax in cui le due onde non sono perfettamente in fase ma sono “molto vicine” alla fase. Questo comporta notevoli difficoltà di calcolo per fasi delle onde differenti da π2 . Per questi motivi, almeno inizialmente, porremo le fasi delle due onde componente pari a π2 .
7.3 I BCS nelle consonanze Vediamo ora cosa succede per la seconda consonanza perfetta in ordine di importanza, l’ottava. Prendiamo dunque due frequenze a distanza di ottava: ν2 = 2ν1 . Utilizzando sempre ν1 = 100 Hz, avremo ν2 = 200 Hz e quindi T1 = 0.01 sec e T2 = 0.005 sec. Torniamo nuovamente a 10 periodi di T1 , pari a 0.1 sec (figura 7.8).
147
7 Le consonanze stonate
Figura 7.7: Quasi-fase nei bcs
Notiamo che le due onde hanno una fasatura un po’ particolare. Non sono infatti perfettamente in fase ad ogni picco, ma ogni due picchi di ψ2 , corrispondenti a 2T2 = T1 secondi. Notiamo anche però che in questo caso la curva di inviluppo non è più una linea retta come nel caso dell’unisono. Infatti, prima nemmeno l’avevamo notata se non dopo l’introduzione dell’errore che ha causato il battimento primario. Ora, pur essendo sempre tangente a tutti i picchi positivi di ψsum , non ne descrive più il profilo superiore, ma ne circoscrive dei
148
7.3 I BCS nelle consonanze
Figura 7.8: ν1 = 100 Hz e ν2 = 200 Hz
periodi regolari in cui i picchi di ψsum sono perfettamente simmetrici. Chiameremo questo periodo periodo di banda e lo indicheremo come TBW . TBW =
1 νBW
In questo caso, essendo νBW = 100 Hz, avremo un periodo di banda TBW = 0.01 sec = T1 . Notiamo anche che la frequenza della bw è uguale a ν1 . Non è un caso e ce ne occuperemo tra poco. Scendiamo ora più nel particolare, a 0.02 secondi = 2T1 e portiamo graficamente l’onda Esum a livello di ψsum , ponendo uguale a zero il coefficiente grafico che abbiamo usato per portarla al di sopra dell’onda somma (figura 7.9). Vediamo che l’onda d’inviluppo circoscrive appunto un area di ψsum (la parte in grigio) e delle sue componenti in cui il loro comportamento risulta simmetrico e costante nel tempo. Ora introduciamo un errore ε su ν2 e prendiamo per esempio ν2 = 215 Hz (figura 7.10 superiore).
149
7 Le consonanze stonate
Figura 7.9: Periodo di banda TBW
Notiamo che le due onde componenti ψ1 e ψ2 si sfasano progressivamente, ma anche che il periodo di banda TBW non è più 0.01 sec ma è ora di pari a TBW = 1/νBW = 1/ (ν2 − ν1 ) = 1/ (215 − 210) ≈ 0.0047. Anche i picchi dell’onda somma ψsum sono ora sfasati rispetti al periodo di banda. Espandiamo la visuale fino ad un secondo e vediamo cosa succede nell’unità di tempo, riportando graficamente Esum al di sopra di ψsum in modo da avere una chiara visione del profilo superiore dell’onda somma (figura 7.10 inferiore). Notiamo un chiaro battimento nel profilo superiore (e inferiore) dell’onda somma ma che non è descritto dall’inviluppo Esum come nel caso del battimento visto precedentemente. Siamo di fronte al primo battimento da consonanza stonata (bcs). È un battimento di 15 Hz, esattamente uguale all’errore che abbiamo introdotto, ma non è più descritto dall’inviluppo dell’onda somma e di fatto non è più uguale a ν2 − ν1 . La curva in alto, segnata nel grafico come β, descrive invece perfettamente il profilo superiore dell’onda ψsum e dunque il battimento bcs. Vedremo tra poco come arrivare a formulare
150
7.3 I BCS nelle consonanze
Figura 7.10: bcs su ottava stonata
β. Dobbiamo prima vedere cosa succede per due frequenze in cui ν2 = 32 ν1 quindi per due suoni in intervallo di quinta giusta. Prendiamo sempre ν1 = 100 e dunque ν2 = 32 100 = 150 Hz. In questo caso avremo T1 = 0.01 sec, T2 = 0.006 sec, νBW = 50 Hz e TBW = 0.02 sec (figura 7.11 superiore). Notiamo anche in questo caso una perfetta regolarità dell’onda ψsum , in moduli di TBW secondi circoscritti dall’onda di inviluppo Esum . L’onda β è ora una linea retta, esattamen-
151
7 Le consonanze stonate
Figura 7.11: TBW : quinta giusta
te come era una linea retta l’onda Esum nel caso dell’unisono perfetto. Passiamo a vedere nel particolare cosa succede: scendiamo a 0.04 secondi = 2TBW (figura 7.11 inferiore). L’onda di inviluppo delimita il periodo regolare di banda TBW che possiamo anche chiamare l’unità di sintonia della coppia di frequenze, un modulo speculare che si ripete costante nel tempo. Notiamo che le onde sono in fase a +1 ogni due picchi di ν1 e ogni 3 picchi di ν2 . In realtà infatti, TBW corrisponde alla unità di sintonia
152
7.3 I BCS nelle consonanze solo per un caso particolare. Nelle consonanze propriamente dette, perfette e imperfette, N = M + 1, pertanto ν2 − ν1 =
(N + 1) ν1 ν1 − ν1 = M M
che è la reale frequenza dell’unità di sintonia che corrisponde dunque a M TS = ν1 Quello che accade, dal punto di vista dei periodi delle onde N ν1 interferiscono, è coinvolte, quando due frequenze ν1 e M che i periodi delle due onde coincidono ogni M T1 e N T2 , infatti: N ν1 ν2 = M T2 =
M T1 N
Quindi N T2 = M T1 Questo equivale a “prendere” M periodi di ν1 e “dividerli” in N parti uguali. È dunque evidente che questa suddivisione si ripeterà ogni M periodi di ν1 , equivalenti ad ogni M T1 secondi. Laddove questa regola non è “rispettata” (asterischi in figura 7.12) è perché in realtà ci troviamo di fronte ad una frazione non ridotta ai minimi termini. Infatti, riguardo alle apparenti eccezioni di figura 7.12, in ordine da sinistra verso destra e dall’alto verso il basso, sono le frazioni: 42 che corrisponde a 21 ; 64 che corrisponde a 32 ; 63 che corrisponde a 2 6 3 8 2 1 ; 2 che corrisponde a 1 ; 4 che corrisponde a 1 .
153
7 Le consonanze stonate
Figura 7.12: N T2 = M T1
Un’altra proprietà matematica interessante di TS = M/ν1 è che si tratta di un periodo di tempo ∆t in cui l’area totale dell’onda somma è pari a zero: t0ˆ+Ts
ψsum dt = 0
t0
Ciò significa che in qualunque periodo di tempo ∆t = TS l’area superiore e l’area inferiore di ψsum sono uguali ed opposte. Ma in ∆t = TS accade anche che: t1ˆ+Ts t2
|ψsum | dt =
t2ˆ+Ts t2
|ψsum | dt
In qualunque periodo di tempo ∆t = TS la superficie, corrispondente alla somma dei valori assoluti dell’area superiore
154
7.3 I BCS nelle consonanze e inferiore, di ψsum è costante. Per esempio, per ν1 = 100 Hz, quindi TS = 0.02 secondi: t+T ˆ S t
N M
=
3 2
e
|ψsum | dt ≈ 0.0161
Chiamando quindi Asup l’area superiore e Ainf l’area inferiore Asup + Ainf = 0 Quindi
Asup + |Ainf | = k Asup = −Ainf =
k 2
Figura 7.13: Area superiore e inferiore di ψsum in ∆t = TS
Torniamo alla quinta giusta. Se ora introduciamo un errore, per esempio di −3 Hz, ci aspetteremmo di trovare un battimento di 3 Hz (figura 7.14). Invece troviamo un battimento di 6 Hz, nuovamente non descritto dall’onda inviluppo Esum ma dall’onda β. νBW è
155
7 Le consonanze stonate
Figura 7.14: bcs su quinta giusta
ora di 47 Hz. Quanto era νBW nel caso della quinta perfetta? Era 150 − 100 = 50 Hz. Nel caso della quinta perfetta, ν1 era un armonico di ν BW , ν1 = 2νBW (e ν2 = 3νBW ). Questo rapporto armonico tra ν1 e νBW è il reale fattore modulante per i battimenti da errore d’intonazione sulle consonanze propriamente dette. Dunque, nelle consonanze propriamente dette (escluso l’unisono: 8P, 5P, 4P, 3M e 3m): ν1 = P νBW = P (ν2 − ν1 ) dove P è un numero intero positivo. Vediamo ora finalmente come arrivare alla formulazione dell’onda β e quindi alla comprensione della natura dei bcs e alla dimostrazione dell’affermazione appena fatta sulle consonanze perfette e imperfette. Per farlo, dobbiamo tornare indietro alle frequenze ν1 e ν2 . La relazione tra queste frequenze può essere genericamente espressa come: ν2 = Rρ ν1 + ε
156
7.3 I BCS nelle consonanze
con Rρ ∈ Q
ε ∈R
quindi da un rapporto Rρ a meno di un errore ε, attualmente non noti. A sua volta Rρ può essere espresso come: Rρ =
N M
con N, M ∈ N+
un rapporto tra due numeri interi positivi, N ed M . Per quanto riguarda le consonanze musicali propriamente dette, costituite dalle consonanze perfette (8P, 5P e 4P) e dalle consonanze imperfette (3M e 3m), il denominatore M è compreso tra 1 e 5 e il numeratore N è uguale a M + 1. Infatti la 8P è 21 , la 5P è 32 , la 4P è 43 , la 3M è 54 e la 3m è 65 . Dunque, per i nostri scopi possiamo porre M = {1; 2; 3; 4; 5} e N = M + 1. Quindi possiamo scrivere la relazione tra ν1 e ν2 come: M +1 ν1 + ε ν2 = M Ci occuperemo in seguito di eventuali consonanze improprie che non soddisfino queste condizioni. Calcoliamo ora il rapporto tra ν1 e νBW , che è il rapporto tra la frequenza più grave e la differenza tra le due frequenze. Chiameremo questo rapporto RBW , rapporto di banda (band width ratio). RBW =
ν1 νBW
Nel caso dell’ottava stonata dell’esempio precedente RBW ≈ 0.8696. Questo rapporto è importante perché esprime la correlazione tra ν1 e νBW la quale, come vedremo, è di somma
157
7 Le consonanze stonate importanza nella comprensione della natura del battimento da consonanza stonata. Infatti la reale frequenza modulante in questo caso non è ν2 ma νBW ed, in particolare proprio il rapporto tra ν1 e ν BW . Se infatti torniamo al caso dell’ottava perfetta, otterremo RBW = 100/100 = 1, quindi ν1 e νBW sono perfettamente all’unisono. Nel caso invece di ν2 = 215, il rapporto tra ν1 e νBW si può chiamare un unisono calante: ν1 è troppo grave rispetto a νBW = 115. Per ottenere degli strumenti matematici da poter applicare anche alle successive consonanze, procediamo come segue. Arrotondiamo RBW al più vicino intero e chiamiamo RBWp il risultato; per questa operazione useremo il simbolo �x� , dove x è la variabile da arrotondare al più vicino intero. RBWp = �RBW � otteniamo RBWp (perfect band width ratio) il rapporto che dovrebbe esserci tra ν1 e νBW se le due frequenze fossero in rapporto armonico (anche di unisono, come nel caso dell’ottava perfetta). Da questo semplice rapporto possiamo ricavare tutto quello che ci serve. Infatti, dato che conosciamo ora quale dovrebbe essere il rapporto consonante tra ν1 e νBW possiamo ricavare l’errore di intonazione η tra ν1 e νBW . Sappiamo infatti che la relazione tra ν1 e νBW (esattamente come la relazione tra ν1 e ν2 ) può essere scritta nella forma: ν1 = RBWp νBW + η Da cui possiamo facilmente ricavare che η = ν1 − RBWp νBW Il modulo di η è la frequenza del battimento da consonanza stonata esattamente come il modulo di ε era la frequenza
158
7.3 I BCS nelle consonanze del battimento primario per frequenze da unisono stonato. Chiameremo νβ la frequenza del bcs e ψβ (β nel grafico), l’onda che lo descrive e dunque l’inviluppo di ordine superiore dell’onda somma ψsum . νβ = |η| ψβ = sin (2πνβ t + φ) Sviluppando νβ fino ad arrivare alle due sole frequenze componenti ν1 e ν2 otteniamo dunque l’equazione che descrive l’inviluppo “secondario” dell’onda somma: � � � � � � � � ν1 � ψβ = sin 2π �ν1 − (ν2 − ν1 )�� t + φ ν2 − ν1
Ecco dunque la formulazione dell’onda ψβ che descrive il battimento bcs2 . Da RBWp però possiamo ricavare anche altre informazioni. Poniamo di avere due frequenze ν1 e ν2p , in relazione di consonanza perfetta senza errori e quindi tali per cui ν2p =
M +1 ν1 M
Se sostituiamo ν2p al posto di ν2 in νBW otteniamo νBWp (perfect band width) intendendo la frequenza di sottrazione (la larghezza di banda tra ν1 e ν2p ) tra due frequenze in relazione di consonanza perfetta: νBWp = ν2p − ν1 = 2 Per
M +1 ν1 ν1 − ν1 = M M
una trattazione estesa delle onde ψβ si rimanda al Capitolo 11
159
7 Le consonanze stonate Quindi M=
ν1 νBWp
Dato che RBW è il rapporto ν1 /νBW e che RBWp è il rapporto che dovrebbero avere ν1 e νBW se il loro rapporto fosse pari ad un intero positivo, possiamo porre M = RBWp E dunque ricavare sia il denominatore che il numeratore della frazione N/M che esprime l’intervallo di giusta intonazione delle frequenze ν1 e ν2 e anche l’errore ε. Infatti: N =M +1 N ν1 M Dalla relazione tra RBWp ed M, possiamo inoltre comprendere meglio la frequenza del battimento νβ = |η|, infatti sappiamo che η = ν1 − RBWp νBW ε = ν2 − ν2p = ν2 −
Dunque, sostituendo RBWp con M , e νBW con ν1 e ν2 , esprimendo poi entrambe le frequenze in funzione di ν1 otteniamo: � � M +1 ν 1 + ε − ν1 = η = ν1 − M (ν2 − ν1 ) = ν1 − M M = ν1 − ν1 − M ν1 + M ν1 − M ε = −M ε
Quindi possiamo anche scrivere:
νβ = |−M ε| 160
7.3 I BCS nelle consonanze e dunque ψβ = sin (2π |M ε| t + φ) Relazione che, come vedremo, è valida per qualunque rapporto N/M , non solo per le conosonanze proprie. Vediamo ora qualche esempio per tutte le consonanze proprie (8P, 5P, 4P, 3M e 3m) e per gli armonici fino al VI, utilizzando come frequenza fondamentale ν1 = 480 Hz ed ε = 2.
161
7 Le consonanze stonate
162
7.3 I BCS nelle consonanze
163
7 Le consonanze stonate
Notiamo che la frequenza del bcs è sempre descritta da M ε ma anche che all’aumentare di N , sia nelle consonanze sia per gli armonici, l’entità della modulazione nell’inviluppo secondario diminuisce proporzionalmente. Di fatto, anche la percezione dei bcs decresce all’aumentare di N oltre che, ovviamente, all’aumentare della frequenza del battimento stesso. Una legge completa che descriva il profilo dei bcs è presentata al Capitolo 11.
7.4 Estensione dei BCS: sintonie ed apotonie Per comprendere come e perché M ε sia la descrizione della frequenza dei bcs per qualunque coppia di frequenze descrivibili come N ν2 = ν1 + ε M dobbiamo approcciare il problema dal lato opposto, analizzando quale sia il rapporto tra due frequenze descrivibili dal
164
7.4 Estensione dei BCS: sintonie ed apotonie rapporto N/M con ε = 0, pertanto in stato di consonanza, anche se impropria. Chiameremo consonanze improprie tutti gli stati di consonanza non descritti come tali in teoria musicale, quindi tutti i rapporti possibili tra due frequenze ν1 e ν2 , tranne 11 , 21 , 32 , 43 , 54 e 65 che sono appunto le consonanze musicali propriamente dette o consonanze proprie. Chiameremo anche sintonie un qualunque rapporto esatto P (dove P è un intero positivo ≥ 1) tra due frequenze ed apotonie, qualunque rapporto P a meno di un errore. Iniziamo col comprendere meglio cosa accade tra due frequenze consonanti proprie o improprie. N ν1 M Da questa relazione, possiamo ricavare che ν2 =
M ν2 = N ν 1 Non facciamoci ingannare dalla forma di questa relazione. Sembrerebbe a prima vista che l’M esimo armonico di ν2 sia uguale all’N esimo armonico di ν1 . Sebbene questo sia vero nei suoni reali, noi stiamo trattando suoni puri, senza armonici. Dunque questa relazione ha in realtà un altro significato. Per capirlo dobbiamo analizzare il rapporto tra i periodi delle due frequenze e, sapendo che T = 1/ν, possiamo affermare che: T2 =
M T1 N
E che: N T2 = M T1 Ora è più chiaro: l’N periodo di ν2 coincide con l’M esimo periodo di ν1 . Se infatti prendiamo per esempio due frequenze ν1 = 200 e ν2 = 300, in rapporto di quinta giusta 32 e esimo
165
7 Le consonanze stonate osserviamo in un arco di tempo pari a 8T1 = 0.08 sec, per avere una visione sufficienetemente ampia (figura 7.15), vedremo confermata la nostra affermazione, infatti il secondo periodo di ν1 coincide con il terzo periodo di ν2 .
Figura 7.15: ν1 = 200 Hz e ν2 = 300 Hz
Non è però forse chiara una cosa molto importante. Come si collocano M ν2 = N ν1 in questa visione del problema? Il valore che se ne ricava è pari al Minimo Comune Multiplo tra le due frequenze: è una frequenza che pur non essendo realmente presente, né nei due suoni singoli né nella loro somma, suddivide (esattamente come il periodo di banda) il tempo in sezioni in cui i picchi di ν1 sono equidistanti (temporalmente) dai picchi di ν2 . Introduciamo dunque M ν2 = N ν1 nel grafico (figura 7.16). La frequenza M ν2 = N ν1 = 600 Hz, è “comune” alle due frequenze singole ν1 e ν2 . Chiameremo per ora impropriamente questa frequenza armonico fantasma sintonico (sph, syntonic phantom harmonic) di frequenza νσ e diremo quindi: ν σ = M ν2 = N ν 1
166
7.4 Estensione dei BCS: sintonie ed apotonie
Figura 7.16: Armonico fantasma sintonico
Ora introduciamo un errore ε, per esempio di 2 Hz, e osserviamo cosa accade. Come già sappiamo le due frequenze si sfasano. E l’sph? Nel precedente caso, con ε = 0, possiamo dire che M ν2 − N ν 1 = 0 infatti le due frequenze sono perfettamente coincidenti, tanto che le abbiamo chiamate con un nome solo (sph). Se ora però poniamo ε �= 0, avremo che ν2 =
N ν1 + ε M
E dunque: M ν2 − N ν 1 = M ε Quindi non possiamo più parlare di frequenza sintonica, dato che tra le due frequenze esiste un errore pari ad M ε. Parleremo impropriamente quindi di una coppia di armonici fantasma apotonici (aph, apotonic phantom harmonics),
167
7 Le consonanze stonate να1 e να2 . Dunque avremo να1 = N ν1 να2 = M ν2 Nel nostro caso quindi να1 = 600 Hz e να2 = 604 Hz. Per non complicare la visuale nel grafico, non utilizzeremo le onde ma le loro derivate prime poste uguali a zero; osserveremo quindi una serie di linee verticali corrispondenti ai picchi delle onde delle due frequenze apotoniche (figura 7.17).
Figura 7.17: Armonici fantasma apotonici
Vediamo che esattamente come le due frequenze ν1 e ν2 anche le due frequenze apotoniche tendono ad allontanarsi, pertanto a sfasarsi. Spostiamo ora graficamente la coppia fantasma apotonica e aggiungiamo l’onda somma ψsum che già conosciamo e l’onda somma delle due aph (figura 7.18 superiore): � � � � ψα = sin 2πνα1 t + π2 + sin 2πνα2 t + π2
Se espandiamo fino ad un secondo (figura 7.18 inferiore) all’unità di tempo, vedremo chiaramente un battimento primario nell’onda somma della coppia di armonici fantasma
168
7.4 Estensione dei BCS: sintonie ed apotonie apotonici che corrisponde esattamente al battimento bcs in ψsum .
Figura 7.18: Battimento primario degli aph
La differenza tra le due frequenze apotoniche è in questo caso |να1 − να2 | = 4 Hz ed è uguale ad |M ε|, dato che |να1 − να2 | = |N ν1 − M ν2 | = |M ε| Dato che ψα è l’onda che descrive la somma di due onde componenti (esattamente come ψsum lo è di ν1 e ν2 ) possiamo
169
7 Le consonanze stonate affermare che il suo inviluppo primario sarà Eα = 2 cos (π |να1 − να2 | t) E quindi, sostituendo la differenza tra gli aph con M ε e ponendo il valore assoluto, dato che, come prima, ci interessano solo i picchi positivi: Eα = |2 cos (π |M ε| t)| Che è la descrizione del battimento bcs di una qualunque N coppia di frequenze ν1 e ν2 in rapporto di M +ε e avrà dunque frequenza pari ad M ε. La definizione, di fatto impropria, di armonici fantasma può però trarre in inganno. Infatti, sappiamo che nella coclea, a causa di fenomeni distorsivi, sono generati gli armonici auricolari. Si potrebbe dunque pensare che la percezione dei bcs possa dipendere dai battimenti tra gli armonici auricolari N ν1 e M ν2 . Dato però che studi in merito hanno dimostrato che mascherando gli armonici auricolari il bcs è ugualmente percepito è necessario rivedere il significato della relazione |N ν1 − M ν2 | = |M ε| anche perché nella nostra simulazione grafica e matematica i due armonici non erano effetivamente presenti, né le funzioni hanno subito alcuna distorsione non lineare, ma la nostra era semplicemente una interpretazione matematica di un fenomeno. Nuovamente, è utile pensare più ai periodi che non alle frequenze. N ν1 è la frequenza di un periodo 1/N ν1 ed M ν2 di un periodo 1/M ν2 . Questi due periodi sono l’espressione in secondi della coincidenza tra i picchi di ν1 e di ν2 . Quando sono differenti a causa di un errore ε applicato a ν2 , i picchi prima coincidenti delle due frequenze subiscono un effetto simile a quelle che in ottica
170
7.4 Estensione dei BCS: sintonie ed apotonie sono chiamate frange di moiré. Le frange di moiré si osservano quando due insiemi di rette parallele hanno spaziatura lievemente diversa, come per esempio quando si guarda attraverso due staccionate parallele o le fenditure di due tapparelle (figura 7.19).
Figura 7.19: Frange di moiré
Quando le rette si sovvrappongono vediamo zone più chiare, quando di allontanano zone più scure. Questo equivale ai battimenti in acustica: quando i picchi dei periodi si sovrappongno in fase sentiremo un aumento dell’intesità del suono, quando invece si sovrappongono in controfase una diminuzione dell’intensità (De Morgan descrisse questo effetto come periodicità di variazione della forma d’onda). Dunque, nel caso di una consonanza (anche impropria) senza errore d’intonazione i due periodi 1/N ν1 ed 1/M ν2 coincidono e rappresentano il tempo in secondi in cui i periodi di ν1 si sovrappongono regolarmente con i periodi di ν2 . Non avremo dunque alcuna frangia di moiré acustica. Se stoniamo ν2 di un errore ε compariranno le frange perchè i due periodi 1/N ν1 e 1/M ν2 non saranno più identici.
171
7 Le consonanze stonate È dunque verosimile che, a prescindere dai possibili armonici auricolari dei prodotti di distorsione della coclea, queste frange di moiré acustiche si ripercuotano sulle modalità di vibrazione della membrana basilare oppure della membrana tectoria, al seguito delle quali l’Organi del Corti invierà impulsi nervosi fino alla corteccia uditiva la quale interpreterà questi segnali come battimenti. Dunque la membrana del timpano, gli ossicini, i liquidi interni della coclea e la membrana tectoria vibreranno riproducendo anche le frange di moiré d’intensità sonora dello stimolo. Il fatto che la membrana basilare sia tonotopica e che dunque entri in risonanza per specifiche frequenze ogni specifica porzione e che quindi non vibri consensualmente all’onda somma per tutta la sua lunghezza ma alle frequenze singole in porzioni diverse, non toglie il fatto che è comunque posta in vibrazione da un’onda somma contenente nel suo inviluppo più esterno delle frange di moiré acustiche che potrebbero ripercuotersi non tonotopicamente sulla membrana basilare (mb) stessa oppure sulla membrana tectoria (figura 7.20). È anche importante notare che più le due frequenze sono lontane, o meglio più aumenta il loro rapporto, meno il bcs è percepibile. Questo potrebbe significare che esiste una seconda banda critica più estesa, una zona della mb compresa tra due porzioni tonotopiche per due frequenze, che possa risentire delle frange di moiré create dalla vibrazione delle due porzioni, per frequenze con rapporto pari a consonanze stonate. Abbiamo anche notato che all’aumentare di N diminuisce l’intensità di variazione nell’inviluppo. Questo dunque non è incompatibile con l’ipotesi di oscillazioni non tonopiche della mb nella zona compresa tra le due frequenze. Gli attuali metodi di misurazione dei pattern di vibrazione della membrana basilare (mb) potrebbero non essere in
172
7.4 Estensione dei BCS: sintonie ed apotonie
Figura 7.20: Ipotesi sulla percezione dei bcs
grado di riconoscere simili eventuali microscopiche oscillazioni. Vi sono infatti quattro metodi utilizzati e descritti in letteratura: 1. Tecnica Mössbauer: questa tecnica prevede l’utilizzo di una piccola sorgente di fotoni gamma posta sulla superfice della mb e un sistema di detezione dell’energia dei fotoni. Data la non-linearità della sorgente stessa le misurazioni sono spesso confuse soprattutto per quanto riguarda vibrazioni conseguenti a due o più suoni
173
7 Le consonanze stonate contemporanei 2. Sonda capacitiva: consiste nel misurare la capacità elettrica tra la mb ed un elettrodo fisso separati da mezzo non conduttore (aria); comporta l’asportazione della maggiore parte della perilinfa della scala timpanica nel sito di misurazione, dunque sebbene sia lineare e molto sensibile, la membrana basilare resta coperta solo da un sottile strato di fluido, il che oltre a poter dare risultati non completamente attendibili, causa danni alla mb stessa 3. Metodi ottici con laser eterodino: non comportano interventi chirurgici sull’animale ma possono al massimo rilevare spostamenti della mb dell’ordine dei nm pari a 10−9 metri, mentre sappiamo che il minimo spostamento utile della mb è 10−13 metri, quattro ordini di grandezza più piccoli di quelli rilevabili con queste tecniche che inoltre possono soffrire di effetti di non linearità e modulazioni di fase e frequenza (alcuni studi suggerirebbero anche che l’attendibilità dei risultati e la profondità di rilevazione di queste tecniche non siano così elevate come riportato in letteratura) 4. Metodi ottici con bersagli riflettenti: prevedono l’uso dell’interferometria ottica. Consistono sostanzialmente nella asportazione della membrana della finestra rotonda e nel posizionamento di grani di vetro rivestiti in oro sulla superfice della mb; la finestra rotonda viene poi richiusa con un sottile strato di vetro per permettere la misurazione tramite l’interferometro posto all’esterno della coclea. L’invasività chiurgica di queste tecniche è dunque piuttosto elevata e può causare danni
174
7.5 La modulazione d’ampiezza e i BCS alle strutture dell’orecchio interno, inoltre non è chiaro se realmente i grani di vetro seguano perfettamente i movimenti della mb Inoltre dobbiamo anche tener presente che le attuali tecniche di misurazione possono misurare in vivo solo le oscillazioni della mb nei dintorni della finestra rotonda o della finestra ovale, quindi per frequenze molto acute e per zone in cui la mb ha il minor grado di flessibilità. Anche questa limitazione potrebbe influire sull’attendibilità delle misurazioni effettuate tramite i metodi attualmente in uso, soprattutto nel caso di oscillazioni microscopiche ed intermodulate come quelle dei bcs.
7.5 La modulazione d’ampiezza e i BCS Può anche essere utile interpretare i bcs da un ulteriore punto di vista. Facciamo una piccola digressione. In telecomunicazione esistono diversi modi per trasmettere un segnale. Quello che ci interessa nello specifico è chiamato modulazione d’ampiezza a banda doppia (am-dsb, amplitude modulation - double side band ). In questo tipo di trasmissione viene utilizzata una frequenza detta portante (carrier ) che chiameremo νC . Poniamo che il segnale che si vuole trasmettere, il messaggio, sia una frequenza νM (figura 7.21). In questa modalità, la frequenza portante νC viene modulata in ampiezza a frequenza νM e il segnale totale inviato ψsignal sarà uguale a ψsignal = [AC + AM cos (2πνM t)] · sin (2πνC t) 175
7 Le consonanze stonate
Figura 7.21: Modulazione d’ampiezza a banda doppia (am-dbs)
dove AC è l’ampiezza della portante ed AM è l’ampiezza del messagio. Dunque l’onda portante (secondo termine della moltiplicazione) viene modulata in ampiezza (primo termine) con frequenza νM . Se sviluppiamo l’equazione usando le leggi trigonometriche otterremo: ψsignal = AC sin (2πνC t) +
+
AM sin (2π (νC − νM ) t) + 2
AM sin (2π (νC + νM ) t) 2
Quindi ψsignal può anche esser vista come la somma di tre onde. Esiste però un’ulteriore possibilità, utilizzata in telecomunicazione per risparmiare energia, che si può ottenere ponendo AC = 0. In questo caso ψsignal diventa la somma di sole due onde perché il primo termine della somma si azzera. In questo caso si parla di banda doppia a portante soppressa
176
7.5 La modulazione d’ampiezza e i BCS (am-dsb-sc, suppressed carrier ). ψsignal =
AM AM sin (2π (νC − νM ) t)+ sin (2π (νC + νM ) t) 2 2
Poniamo ora ν1 = νC − νM ν 2 = νC + ν M
Figura 7.22: Modulazione d’ampiezza e frequenze ν1 e ν2
E sostituiamo: ψsignal =
AM AM sin (2πν1 t) + sin (2πν2 t) 2 2
Per ottenere ampiezza unitaria per entrambe le onde porremo AM = 2, quindi: ψsignal = sin (2πν1 t) + sin (2πν2 t) E siamo finalmente arrivati alla somma delle due onde ν2 e ν1 (figura 7.22). Proviamo ora a fare il passaggio inverso
177
7 Le consonanze stonate esprimendo νM e νC in funzione di ν2 e ν1 nella prima forma di ψsignal . Possiamo dire che νC =
ν 2 + ν1 2
perché ν C = ν2 − ν M ν M = νC − ν 1
quindi
ν C = ν2 − ν C + ν 1 2νC = ν1 + ν2 Allo stesso modo è possibile ottenere che νM =
ν 2 − ν1 2
Dunque, con AM = 2: �� � � � � ν 2 + ν1 ν2 − ν1 ψsignal = AC + 2 cos 2π t · sin 2π t 2 2 pertanto ψsignal
� � ν 2 + ν1 t + sin (2πν1 t) + sin (2πν2 t) = AC sin 2π 2
Se AC = 0 avremo portante soppressa se AC �= 0 avremo una portante intera. Questo comporta che se la portante non è soppressa ψsignal è la somma di tre onde, mentre se la portante è soppressa è la somma di due onde. Notiamo 1 (il messaggio) è esattamente la metà anche che νM = ν2 −ν 2 di quella che abbiamo precedentemente chiamato larghezza
178
7.5 La modulazione d’ampiezza e i BCS di banda νBW , che infatti era la differenza tra ν2 e ν1 . Dato che noi abbiamo a che fare con due sole onde pure possiamo porre AC = 0 e otterremo: � � � � ν 2 + ν1 ν2 − ν 1 t · sin 2π t ψsignal = 2 cos 2π 2 2 ψsignal = sin (2πν1 t) + sin (2πν2 t) Il che significa che la somma di due onde di frequenza ν1 e ν2 può anche essere interpretata come un’onda di frequenza ν2 +ν1 (la portante soppressa) modulata in ampiezza con fre2 1 (il messaggio). Facciamo un esempio pratico: quenza ν2 −ν 2 ν1 = 100 Hz e ν2 = 110 Hz. Avremo: ψsignal = 2 cos (2π5t) · sin (2π105t) ψsignal = sin (2π100t) + sin (2π110t) Sappiamo che la somma di queste due onde darà un battimento di 10 Hz e che verrà percepita un frequenza pari alla media aritmetica delle due frequenze componente. Infatti, vediamo che νC = 105 Hz (la frequenza percepita) e che la sua ampiezza è modulata a 5 Hz, o meglio a 2 · 5 = 10 Hz quindi cos (π10t), perché ad ogni picco negativo corrisponde un picco positivo e viceversa. Dunque abbiamo una descrizione del battimento primario che è il messaggio (νM ) della trasmissione. Notiamo anche che il termine 2 cos (2π5t) È l’inviluppo Esum dell’onda somma. Poniamo ora ν1 = 100 e ν2 = 150 Hz, quindi ν2 = 32 ν1 la sua quinta giusta. ψsignal = 2 cos (2π25t) · sin (2π125t) 179
7 Le consonanze stonate ψsignal = sin (2π100t) + sin (2π150t) Da notare è che la portante soppressa νC = 125 Hz è la terza maggiore di ν1 e che il messaggio νM = ν1 /4 o meglio ν1 = 4νM : ν1 è un’armonico del messaggio. Ma anche νM = ν2 /6 quindi ν2 = 6νM : anche ν2 è un’armonico del messaggio. In generale, possiamo dire che ν1 = 2M νM ν2 = 2N νM Le due frequenze componente sono armonici del messaggio secondo il rapporto N/M . Questo è valido solo per le consonanze propriamente dette dove N = M + 1. Se ora esprimiamo ν2 in funzione di ν1 in una consonanza priopriamente detta (N = M + 1) a meno di un errore ε ν2 =
M +1 ν1 + ε M
e ricaviamo νM in funzione di ν1 νM =
M +1 M ν1
+ ε − ν1 M ν 1 − M ν1 + ν1 + M ε ν1 + M ε = = 2 2M 2M
e in funzione di ν2 νM =
ν2 −
M ν2 −M ε M +1
2
=
M ν2 + ν 2 − M ν 2 + M ε ν2 + M ε = 2 (M + 1) 2 (M + 1)
Quindi 2M νM = ν1 + M ε 2 (M + 1) νM = ν2 + M ε
180
7.5 La modulazione d’ampiezza e i BCS Nel caso di una consonanza propria stonata a meno di un errore ε, le due frequenze componente sono armonici del messaggio a meno di un errore M ε, che è la frequenza del bcs e quindi della modulazione dell’inviluppo secondario dell’onda. Proponiamo ora un esperimento ideale. Siano ν1 = 100 Hz e ν2 = 151 Hz una quinta giusta stonata di 1 Hz. Immaginiamo di avere a disposizione quattro risuonatori di Helmholtz 3 con frequenza di risonanza rispettivamente 100, 151, 125.5 e 25.5 Hz. Li chiameremo H100 , H151 , H125.5 e H25.5 . È intuitivo che i risuonatori H100 e H151 risuoneranno avendo frequenza di risonanza uguale alle frequenze delle componenti dell’onda somma. Ma sapendo che ψsignal = 2 cos (2π25.5t) · sin (2π125.5t) ψsignal = sin (2π100t) + sin (2π151t) Cosa faranno i risuonatori H125.5 e H25.5 ? Non risuoneranno. H125.5 non può entrare in risonanza con la portante, perché è soppressa (AC = 0). H25.5 non può entrare in risonanza col messaggio perché deve essere prima demodulato dal segnale. 3I
risuonatori di Helmholtz sono, nella forma più classica, contenitori in vetro che entrano in risonanza ad una determinata frequenza. Una semplice bottiglia di plastica, può funzionare come un risuonatore di Helmholtz (la frequenza caratteristica di una bottiglietta da 0.5 litri varia da 190 a 210 Hz circa). Le sue applicazioni sono molteplici, dalla aeronautica ai circuiti elettronici ecc. La mb funziona come una batteria di risuonatori di Helmholtz: ogni singola porzione della mb risuona ad una determinata frequenza a causa delle sue caratteristiche.
181
7 Le consonanze stonate Dunque, supponendo la membrana basilare funzioni perfettamente 4 come un risuonatore di Helmholtz, non può entrare in risonanza né con la portante soppressa né col messaggio modulato nel segnale. Ciò non toglie che per frequenze sufficientemente vicine, la porzione di mb compresa tra di esse possa mostrare lievi oscillazioni dovute all’inviluppo secondario dell’onda a cui è sottoposta e le cui componenti sono entrate in risonanza con le rispettive zone tonopiche della mb. Inoltre, aggiungendo la portante o comunque una terza frequenza compresa tra le due (quindi un bcs dovuto a tre frequenze di cui ci occuperemo nel Capitolo 10) il battimento è più facilmente percepibile, a sostegno del fatto che potrebbe proprio essere la porzione compresa tra le due frequenze più grave e più acuta a inviare informazioni al sistema nervoso centrale.
7.6 La modulazione di fase e i BCS Sviluppando l’equazione dell’onda somma ψsum si può ottenere un ulteriore interpretazione dei bcs. � � � � N ν+ε t+φ ψsum = sin (2πνt + φ) + sin 2π M � � N ψsum = sin (2πνt + φ) + sin 2π νt + (φ + 2πεt) M
Il termine 2πεt implica una modulazione di fase lineare dell’onda componente “stonata”. La fase dell’onda corrispon4 Una
delle obiezioni mosse alla teoria della mb come risuonatore di Helmholtz sostiene che la mb non sia un perfetto risuonatore, ma sia sottoposta anche a oscillazioni non tonotopiche.
182
7.6 La modulazione di fase e i BCS dente a ν2 varia linearmente rispetto al tempo t quando ε �= 0. La modulazione di fase (pm, phase modulation) è un’altra tecnica utilizzata in telecomunicazione per inviare un segnale. L’onda portante è modulata nella fase dal messaggio. In quel caso però la modulazione di fase dell’onda portante non è lineare e anche la fase varia secondo una funzione sinusoidale. La variazione sinusoidale della fase, porta ad una variazione di frequenza dell’onda del segnale chiamata «modulazione di frequenza» (fm, frequency modulation). Non è questo il caso, dato che in ψsum la fase varia in modo lineare rispetto al tempot. Per t = 0 la ψsum si riduce pertanto a sin φ + sin φ , indipendentemente da ε; sarà pari 0 per φ = 0 e per φ = π, a 2 per φ = π2 e a −2 per φ = 32 π. Considerato che la funzione seno è periodica per 2π e che quindi una fase φ è equivalente a φ + n2π (dove n ∈ N), possiamo dedurre che per t = n/ε la fase di ν2 sarà pari a φ + n2π, corrispondente quindi a φ. Pertanto, ogni n/ε secondi le due onde componente hanno medisma fase φ come in t = 0. Dato che la frequenza dei bcs è νβ = |M ε|, possiamo dire anche che per ε=
1 M
avremo un battimento di 1 Hz e, più in generale, che per ε=
m M
(dove m ∈ Z) avremo un battimento di frequenza m (questa proprietà ci sarà utile nel Capitolo 11). ε=
m M
⇒
νβ = m
183
7 Le consonanze stonate Dunque in questo caso le due onde saranno in fase per t = n/ε = nM/m.
7.7 BCS per frequenze ad errore ignoto Dobbiamo notare che il sistema matematico visto fin qui, funziona se sono già noti il rapporto N/M e l’errore ε. Laddove invece siano date due frequenze il cui rapporto N/M (ed errore ε) siano ignoti, si può utilizzare un approccio sistematico, gentilmente proposto dal Dr. Carlo Andrea Rozzi5 del cnr (Istituto di Nanoscienze). Il Dr. Rozzi propone dunque una formula per trovare tutti quelli che noi abbiamo qui chiamato armonici fantasma sintonici o apotonici tra due frequenze ν1 e ν2 (le frequenze corrispondenti ai periodi di coincidenza o non coincidenza dei picchi delle due onde componente): f (N ; M ) = |N ν1 − M ν2 | con N > M . Quando sia stata trovata una coppia di interi positivi N e M , tali per cui 0 < f (N ; M ) ≤ 15 Hz avremo una coppia di aph, i termini del rapporto che descrive la relazione tra le due frequenze ν1 ed ν2 ed anche l’eventuale errore di intonazione ε. Nel caso in cui si trovi una coppia di N e M tali per cui f (N ; M ) = 0 avremo trovato un sph e potremo dunque dedurre che le due frequenze saranno in rapporto sintonico N/M , senza errori di intonazione. In tal caso, se M ≤ 5 ed N = M + 1 avremo scoperto che le due frequenze sono in intervallo di consonanza propriamente detta, 5 Corrispondenza
184
privata con l’Autore
7.8 Ipotesi sulla percezione dei BCS altrimenti saranno una consonanza impropria descritta dal rapporto N/M . Abbiamo posto il limite di 15 Hz, per il fatto che i bcs (soprattuto per frequenze consonanti improprie) sono molto meno udibili dei battimenti primari e nonostante crediamo giochino sicuramente un ruolo fondamentale nella percezione di consonanze e dissonanze, altrettanto sicuramente influenzano in modo minore l’ascolto di una coppia di suoni. Essendo il limite per i battimenti primari di circa 30 Hz, abbiamo scelto di porre un limite, relativamente arbitrario, pari alla metà. Dunque, come dicevamo, una volta trovata la coppia N/M che interessa la nostra analisi, potremo ricavare l’eventuale errore di intonazione ε: ε=
|N ν1 − M ν2 | M
e dunque potremo scrivere: ν2 =
N |N ν1 − M ν2 | ν1 + M M
7.8 Ipotesi sulla percezione dei BCS Come accennato precedentemente, le ipotesi sulla percezione dei bcs sono numerose. Ne faremo qui un breve riassunto. 1. bcs come effetto di II ordine. In questo caso si ipotizza che i bcs siano il risultato di una elaborazione a posteriori del sistema nervoso ma che non abbiano alcun corrispettivo nei segnali inviati dalla mb. Questa ipotesi, sta lentamente passando in secondo piano, man
185
7 Le consonanze stonate mano che si scoprono nuove interazioni tra le strutture della mb e della coclea nel suo complesso. 2. bcs come effetto di I ordine. a) Per interazione degli armonici auricolari. È una delle prime ipotesi formulate. È stato però dimostrato in letteratura che il mascheramento degli armonici auricolari (corrispondenti in questo caso a quelli che abbiamo chiamato phantom harmonics) non impedisce la percezione dei bcs. b) Per interazione dei prodotti di intermodulazione. Anche questa ipotesi suggerirebbe un ruolo della non-linearità della distorsione dell’orecchio. Studi hanno però dimostrato che anche a volumi contenuti, al di sotto della soglia di distorsione, i bcs possono essere percepiti. c) La mb non è un perfetto risuonatore di Helmholtz. In questo caso si ipotizza che la mb non segua perfettamente la teoria ma che possa subire oscillazioni non tonotopiche causate dall’onda trasmessa all’interno della coclea. Fu formulata per primo da De Morgan in 1864. d) Oscillazioni della mb nella porzione compresa tra le due regioni tonotopiche. È l’ipotesi di cui abbiamo parlato in precedenza: la mb oscillerebbe non tonopicamente ma riproducendo alcune delle proprietà dell’onda somma, nella zona compresa tra la regione a frequenza di risonanza più grave e quella più acuta. e) Oscillazioni e onde di superficie della membrana tectoria. Questa è forse l’ipotesi che si sta studian-
186
7.8 Ipotesi sulla percezione dei BCS do maggiormente. Misurazioni, calcoli matematici e simulazioni indicano sempre più la membrana tectoria come una struttura con un ruolo attivo nel funzionamento globale della coclea. Non siamo attualmente a conoscenza di studi specifici in merito a bcs e membrana tectoria, ma la possibilità che ne sia responsabile è decisamente elevata. Oscillando potrebbe dunque perturbare le vibrazioni delle zone tonopiche della mb riproducendo la forma dell’inviluppo secondario dell’onda stimolo e dunque gli evetuali bcs.
187
8 Sintonie questo capitolo analizzeremo un semplice esperimento Isunquelle grafico che sarà in grado di fornirici ulteriori informazioni che chiameremo sintonie. Quello che faremo è l’equivalente grafico di una tecnica molto usata in psicoacustica: combineremo un tono fisso con uno sweep. Uno sweep è un suono (puro o complesso) che, in un lasso di tempo predeterminato, aumenta in frequenza da una frequenza iniziale ν0 ad una frequenza finale νmax . Lo sweep è utilizzato da solo, non combinato, anche in otorinolaringoiatria (per esempio, per tracciare l’audiogramma) e in acustica tecnica per sondare la risonanza degli ambienti e per misurare il range di riproduzione degli altoparlanti. Noi useremo le onde di due toni puri, uno fisso e uno sweep, per ottenere un semplice grafico che possa mostrarci tutti gli stati sintonici di due frequenze nell’arco di una ottava. Utilizzeremo dunque lo sweep come la manopola di sintonia di una radio: ai contorni di una “stazione di sintonia” vedremo delle “bande” (i bcs) e sapremo che al loro centro ci sarà un particolare rapporto che chiameremo sintonico e che andremo a calcolare.
189
8 Sintonie
8.1 Definizione di sweep Siano quindi date un’onda ψν a frequenza costante ν, un’onda ψvar a frequenza variabile νvar e la loro somma ψsweep . ψν = sin (2πνt + φ) ψvar = sin (2πνvar t + φ) ψsweep = ψν + ψvar Porremo la fase φ = π2 in modo tale da avere le due componenti in fase a +1 per t = 0 e quindi l’onda somma ψ sweep a +2 in t = 0. Vogliamo che la frequenza istantanea della seconda componente ψvar , in un arco di tempo determinato, vari da ν a 2ν (un’ottava). La frequenza istantanea νi di un’onda sinusoidale ψ = sin (ωt + φ), dove ω = 2πν è la velocità angolare, è matematicamente definita come: νi =
1 ∂ · (ωt + φ) 2π ∂t
Quindi, è la derivata prima dell’argomento del seno, divisa per 2π. Vogliamo che νi sia uguale a ν + t cosicchè il tempo t sia l’espressione della differenza tra ν e la frequenza istantanea di ψvar : t = νi − ν. Pertanto νvar sarà uguale a ν + kt, dove k è una costante che dipende dalla relazione tra νi e ν + t. Dunque possiamo risolvere la seguente equazione in funzione di k: νi = ν + t 1 ∂ · [2π (ν + kt) + φ] = ν + t 2π ∂t 190
8.1 Definizione di sweep 1 (4πkt + 2πν) = ν + t 2π 2kt + ν = ν + t Da cui ricaviamo che k=
1 2
Pertanto l’onda ψvar di nostro interesse sarà pari a � � � � t t+φ ψvar = sin 2π ν + 2 Infatti in questo caso � � � � t 1 1 ∂ · 2π ν + t+φ = 2π (ν + t) = ν + t νi = 2π ∂t 2 2π Pertanto, νi di ψvar varia da ν a 2ν tra tmin = 0 e tmax = ν. Scegliamo, per esempio, ν = 100 Hz e valutiamo il grafico di νi di ψvar tra tmin = 0 e tmax = 100 (figura 8.1).
Figura 8.1: Frequenza istantanea di ψvar tra tmin = 0 e tmax = ν
191
8 Sintonie Come ci aspettavamo, y (= νi la frequenza istantanea di ψvar ) varia da 100 (= ν) a 200 (= 2ν) per x (= t il tempo) compreso tra 0 e 100 (= ν). Dunque ψsweep quale combinazione di ψν e ψvar è � � � � � � t t + π2 ψsweep = sin 2πνt + π2 + sin 2π ν + 2
Avendo posto la fase φ = π2 . Pertanto, leggendo il grafico corrispondente tra tmin = 0 e tmax = ν otterremo una visione d’insieme delle sintonie (in quanto definibili da rapporti semplici) e degli errori d’intonazione, su una ottava. Nel caso di ψvar possiamo dunque dire che la frequenza istantanea al tempo t è pari a νi = ν + t
8.2 Analisi e sintesi delle sintonie Vediamo, per iniziare, il grafico completo per ν = 30 Hz, tra tmin = 0 e tmax = 30 (figura 8.2; abbiamo scelto questa frequenza a causa delle limitazioni grafiche del programma utilizzato; successivamente useremo frequenze e intervalli d’osservazione più idonei ad una trattazione dettagliata). Notiamo già alcune caratteristiche molto interessanti. All’estrema sinistra, per t ≈ 0, è chiaramente visibile l’inviluppo primario dell’onda che si contrae nei battimenti primari, sempre più frequenti all’aumentare della frequenza di ψvar . Infatti per t = 0, ψvar ha la medesima frequenza istantanea di ψν , dunque sono in rapporto di unisono perfetto. All’aumentare di νi aumenta l’errore d’intonazione sull’intervallo di
192
8.2 Analisi e sintesi delle sintonie
Figura 8.2: ψsweep per ν = 30 Hz
unisono e dunque compaiono i battimenti primari, le modulazioni in ampiezza dell’onda somma ψsweep . Successivamente, troviamo le prime sintonie, per t = 10, t = 15, t = 20 e t = 30. Come vedremo tra poco, ve ne sono molte altre, ma queste sono talmente forti da poter essere chiaramente distinte anche in questo ampio intervallo grafico. Analizziamo innanzitutto la sintonia per t = 30: la frequenza istantanea di ψvar per questo valore di t è νi = ν + t = 30 + 30 = 60 Hz. Dunque le due componenti sono in intervallo di ottava perfetta (ratio 21 ). Infatti, i “solchi” dei battimenti da consonanza stonata nell’inviluppo secondario di ψsweep sono più “profondi” che nelle altre sintonie visibili in questo grafico (escluso l’unisono): l’ampiezza massima di ψsweep nel punto di cuspide negativa dei bcs (vedi il Capitolo 11 per una trattazione estesa dell’argomento) è minore rispetto alle altre sintonie, escluso l’unisono. Al centro del grafico, per t = 15 osserviamo una sintonia piuttosto marcata. La frequenza istantanea di ψvar in questo punto è νi = ν + t = 30 + 15 = 45 Hz. La ratio νi /ν è pari a 32 e le due frequenze sono in rapporto
193
8 Sintonie di quinta giusta. Per t = 10 otteniamo invece νi = 40 Hz. La ratio νi /ν è in questo caso di 43 . Pertanto νi è la quarta giusta di ν. Per t = 20 la frequenza istantanea di ψvar è pari a νi = 50 Hz, pertanto la ratio νi /ν corrisponde a 53 , una sesta maggiore. Di fatto, queste cinque ratio ( 11 , 21 , 32 , 43 e 53 ) sono, in ordine crescente, le frazioni a minor IC , cioè a minor grado di complessità razionale: sono quindi le frazioni esprimenti gli intervalli più consonanti del sistema a giusta intonazione. In ordine decrescente per consonanza e semplicità razionale sono pertanto: unisono perfetto, ratio 11 e IC =0; ottava perfetta, ratio 21 e IC =1; quinta giusta, ratio 32 e IC =3; quarta giusta, ratio 43 e IC =5; sesta maggiore, ratio 53 e IC =6 (figura 8.3).
Figura 8.3: Ratio delle sintonie maggiori (ν = 30 Hz)
Scegliamo ora una frequenza ν idonea ad una analisi più dettagliata. Per esempio, possiamo scegliere ν = 120 Hz, essendo divisibile per 1, 2, 3, 4, 5, 6, 8 ecc. quindi per tutti i denominatori delle frazioni del sistema a giusta intonazione (tranne 45 32 ). Possiamo osservare ψsweep ad intervalli di
194
8.2 Analisi e sintesi delle sintonie ∆t = 7. Avremo dunque 18 intervalli d’osservazione (17, più un’ultimo intervallo che oltrepassa l’ottava) tra νi = 120 per t = 0 e νi = 240 per t = 120. Analizziamo dunque ogni singolo intervallo di 7 secondi (e 7 Hz di νi ), le sintonie relative (figure da 8.4 a 8.9) e il rapporto frazionario che le definisce. 120 ≤ νi ≤ 127 In questo intervallo (figura 8.4 in alto) l’unico evento visibile è la “contrazione” dell’inviluppo primario dell’onda ψsweep nei battimenti primari, sempre più frequenti all’aumentare di νi . 127 ≤ νi ≤ 134 È qui possibile intravedere (figura 8.4 al centro) solo due debolissime sintonie per t = 12 e νi = 132 dunque ratio νi /ν = 11 10 e per t = 13.3 quindi νi = 133.3 e ratio νi /ν = 10 9 , il tono piccolo di cui abbiamo parlato nel Capitolo 6. Abbiamo segnato il punto in cui dovrebbe trovarsi la 2m (ratio 16 15 ) per t = 8 quindi νi = 128. Oltre ad avere un elevato IC (16 + 15–2 = 29) è in una zona in cui i battimenti primari sono ancora troppo evidenti, pertanto non è distinguibile. 134 ≤ νi ≤ 141 Troviamo qui (figura 8.4 in basso) sintonie sempre più evidenti a partire da t = 15, νi = 135 Hz, ratio 98 , la seconda maggiore di giusta intonazione; t ≈ 17.1428, νi ≈ 137.1428, ratio 8 7 , utilizzata nell’armonia settimale; t = 20, νi = 140 Hz, ratio 76 , il tono supermaggiore dell’antica musica bizantina. 141 ≤ νi ≤ 148 Una sintonia ancora più marcata (figura 8.5 in alto), per t = 24 e νi = 144, è chiaramente visibile: la terza minore di giusta intonazione di
195
8 Sintonie
Figura 8.4: ψsweep per 120 ≤ νi ≤ 127 Hz (in alto); 127 ≤ νi ≤ 134 Hz (al centro); 134 ≤ νi ≤ 141 Hz (in basso)
196
8.2 Analisi e sintesi delle sintonie
Figura 8.5: ψsweep per 141 ≤ νi ≤ 148 Hz (in alto); 148 ≤ νi ≤ 155 Hz (al centro); 155 ≤ νi ≤ 162 Hz (in basso)
197
8 Sintonie
Figura 8.6: ψsweep per 162 ≤ νi ≤ 169 Hz (in alto); 169 ≤ νi ≤ 176 Hz (al centro); 176 ≤ νi ≤ 183 Hz ( in basso)
198
8.2 Analisi e sintesi delle sintonie
Figura 8.7: ψsweep per: 183 ≤ νi ≤ 190 Hz (in alto); 190 ≤ νi ≤ 197 Hz (al centro); 197 ≤ νi ≤ 204 Hz (in basso)
199
8 Sintonie
Figura 8.8: ψsweep per: ; 204 ≤ νi ≤ 211 Hz (in alto); 211 ≤ νi ≤ 218 Hz (al centro); 218 ≤ νi ≤ 225 Hz (in basso)
200
8.2 Analisi e sintesi delle sintonie
Figura 8.9: ψsweep per 225 ≤ νi ≤ 246 Hz
201
8 Sintonie ratio 65 . Per t = 26.6 e νi = 146.6 si può intravedere una debolissima sintonia di ratio 11 9 , non utilizzata. 148 ≤ νi ≤ 155 In questo ∆νi (figura 8.5 al centro), la sintonia di terza maggiore di giusta intonazione per t = 30 e dunque νi = 150 Hz è decisamente evidente, mentre è possibile distinguere una più debole sintonia per t ≈ 34.2857 e νi ≈ 154.2857, ratio 97 , un’intervallo dell’armonia settimale. 155 ≤ νi ≤ 162 Ritroviamo qui (figura 8.5 in basso) la sintonia forte di quarta giusta per t = 40 e νi = 160 Hz, che avevamo già potuto chiaramente distinguere nel primo grafico generale. Notiamo infatti la profondità e l’estensione dei bcs rispetto alle precedenti sintonie più deboli. 162 ≤ νi ≤ 169 Siamo tra la 4P e la 5P e troveremo quindi alcuni intervalli definenti il tritono (figura 8.6 in alto). Infatti, per t = 45 e νi = 165 Hz distinguiamo una debole sintonia di ratio 11 8 , mentre per t = 48 e νi = 168 Hz una sintonia più marcata di ratio 75 , il tritono settimale. L’asterisco per t = 48.75 e quindi νi = 168.75 indica il punto in cui si trova l’intervallo di quarta aumentata di giusta intonazione di ratio 45 32 , che è pertanto “sommerso” tra i bcs di 75 , oltre ad avere un IC notevolmente elevato (45 + 32–2 = 75). 169 ≤ νi ≤ 176 Possiamo in questo ∆νi (figura 8.6 al centro) solamente intravedere una debolissima sintonia per t ≈ 51.4286 e νi ≈ 171.4286 con ratio 10 7 . 202
8.2 Analisi e sintesi delle sintonie Ai limiti superiori notiamo invece dei bcs piuttosti intensi (freccia nella figura) che preludono ad una sintonia forte. 176 ≤ νi ≤ 183 Ora (figura 8.6 in basso) è infatti evidente la sintonia di quinta giusta per t = 60 e νi = 180 Hz. 183 ≤ νi ≤ 190 Da questo intervallo (figura 8.7 in alto) non ci aspettiamo sintonie importanti essendo ancora troppo vicini a 5P. Infatti, intravediamo solo una debolissima sintonia (t ≈ 68.5714, νi ≈ 188.5714, ratio 11 7 ). 190 ≤ νi ≤ 197 Notiamo (figura 8.7 al centro) un altro intervallo di giusta intonazione, dissonante, l’intervallo di sesta minore (ratio 85 ) per t = 72 e dunque νi = 192 Hz. Una debolissima sintonia è distinguibile per t = 75 e νi = 195 Hz, pari a 13 8 , utilizzata in passato quale sesta minore in sistemi differenti da quello di giusta intonazione. 197 ≤ νi ≤ 204 Ritroviamo (figura 8.7 in basso) un’altra delle sintonie forti visibili anche nel grafico generale di figura 8.3, la sesta maggiore di giusta intonazione di ratio 53 , per t = 80 e νi = 200 Hz. 204 ≤ νi ≤ 211 Per t = 90 e νi = 210 Hz (figura 8.8 in alto), la sintonia piuttosto marcata di ratio 74 , la settima minore dell’armonia settimale. 211 ≤ νi ≤ 218 In questo intervallo (figura 8.8 al centro) notiamo la settima minore di giusta intonazione di
203
8 Sintonie 9 5,
per t = 96 e νi = 216 Hz. Come si vede confrontandola con la sintonia 74 del precedente ∆νi , l’IC dei due intervalli è compatibile con la forza della sintonia infatti 74 con IC = 7 + 4 − 2 = 9 è più sintonico di 95 con IC = 9 + 5 − 2 = 12. 218 ≤ νi ≤ 225 Nell’intervallo d’osservazione tra νi = 218 e νi = 225 (figura 8.8 in basso), si distinguono solamente due debolissime sintonie per t = 100 e νi = 220 Hz (ratio 11 6 ) e per t ≈ 102.8571 e νi ≈ 222.8571 (ratio 13 7 ). A “cavallo” tra questo intervallo e il successivo, si intravede la debolissima sintonia per t = 105 e νi = 225 Hz, di ratio 15 8 , la settima maggiore di giusta intonazione, di fatto definita dissonante. 225 ≤ νi ≤ 246 Gli ultimi ∆νi (figura 8.9) sono completamente “saturati” dai bcs della consonanza forte di ottava perfetta per t = 120 e νi = 240 Hz. Dunque, il “livello di sintonia” degli intervalli trovati è compatibile con l’indice di complessità razionale delle frazioni corrispondenti. Possiamo, per riassumere, raccogliere tutti gli intervalli analizzati in questo semplice esperimento, ordinandoli in ordine crescente di IC ed associando a ciascun intervallo una osservazione di ψsweep per ν = 120 Hz in un intervallo d’osservazione ∆t = 3 in cui al centro vi sarà la sintonia relativa (R: ratio; IC : indice di complessità razionale; I: intervallo; gli intervalli di giusta intonazione sono scritti con la sigla corrispondente; 7m7le : settima minore settimale; Tr7le : tritono settimale; TsM: tono supermaggiore; Tp: tono piccolo).
204
8.2 Analisi e sintesi delle sintonie R
IC
I
1 1
0
1P
2 1
1
8P
3 2
3
5P
4 3
5
4P
5 3
6
6M
Sintonia
205
8 Sintonie
206
5 4
7
3M
6 5
9
3m
7 4
9
7m7le
7 5
10
Tr7le
8 5
11
6m
8.2 Analisi e sintesi delle sintonie
7 6
11
TsM
9 5
12
7m
8 7
13
9 7
14
11 6
15
207
8 Sintonie
208
10 7
15
9 8
15
11 7
16
11 8
17
10 9
17
2M
Tp
8.2 Analisi e sintesi delle sintonie
13 7
18
11 9
18
13 8
19
11 10
19
15 8
23
7M
209
8 Sintonie
8.3 La curva delle frazioni Inserendo tutte le frazioni analizzate in un grafico, in cui sull’asse y leggiamo l’IC e sull’asse x la ratio, otteniamo una visione d’insieme di tutti gli intervalli trattati (figura 8.10).
Figura 8.10: Grafico delle sintonie entro l’ottava
Tra IC =0 e IC =9 troviamo tutte le consonanze perfette e imperfette del sistema a giusta intonazione, dall’unisono alla terza minore, compresa la sesta maggiore ( 53 ) e la settima minore dell’armonia settimale ( 74 ). Da IC =10 in poi, gli intervalli non sono più definiti consonanze ma dissonanze. Per avere un idea più precisa dell’importanza delle consonanze nell’intervallo di una ottava, possiamo utilizzare una linea smussata e completare il grafico con tutte le frazioni ridotte
210
8.3 La curva delle frazioni ai minimi termini fino a denominatore 32, per comprendere anche la 2m e la 4� di giusta intonazione (figura 8.11).
Figura 8.11: Curva delle frazioni
Notiamo innazitutto che tutte le consonanze del sistema a giusta intonazione si trovano sui picchi di questa curva molto irregolare. Nonostante l’elevata irregolarità, possiamo però distinguere una sorta di “inviluppo superiore” della curva, formato dai picchi precedenti e successivi a 32 5P (figura 8.12). I picchi prima di 32 sono tutti formati da frazioni di tipo N N 2 M con N = M + 1. Per M = 1, M è 1 l’ottava. Dunque, a 3 partire da 2 verso 1, avremo le frazioni 43 , 54 , 65 , 76 , 87 , 98 ecc. N I picchi successivi a 32 sono formati da frazioni M in una serie tale per cui, denominati Ni e Mi il numeratore e il denominatore alla posizione i, Ni+1 = Ni + 2 ed Mi+1 = Mi + 1, con N1 = 3 ed M1 = 2 quindi N1 /M1 = 3/2. In
211
8 Sintonie
Figura 8.12: Inviluppo della curva delle frazioni
questo modo accade che N = 2M − 1. Pertanto, a partire da 3 2 5 7 9 11 13 15 2 verso 1 , troveremo le frazioni 3 , 4 , 5 , 6 , 7 , 8 ecc. Quindi abbiamo in realtà due “inviluppi”, uno per frazioni minori di 32 e uno per frazioni maggiori di 32 (figura 8.13 in alto). Utilizzando una equazione del tipo: � � x E= y dove x è la ratio del rapporto e y è l’IC � � ratio E= IC
ed esprimendola in funzione di M , possiamo dunque dire che la curva dell’inviluppo E1 da 1 e 1.5 è data dall’equazione: M +1 M E1 = M + (M + 1) − 2
212
8.3 La curva delle frazioni
Figura 8.13: Inviluppi primari della curva delle frazioni
Con M = {1 . . . ∞}. Mentre la curva dell’inviluppo E2 da 1.5 a 2 è data dall’equazione: 2M − 1 M E2 = M + (2M − 1) − 2
Con M = {1 . . . ∞} (vedi figura 8.13 in basso). Pertanto, per M → ∞, E1 = [1; 0] ed E2 = [2; 1]. Le frazioni a minore grado di complessità (a minor indice di
213
8 Sintonie complessità razionale IC ) si trovano su queste due curve per ogni valore intero di M : la ratio della frazione è sull’asse delle x mentre l’IC della frazione corrispondente è leggibile sull’asse delle y. Le due curve si intersecano per x = 1.5 dunque per M = 2, N = 32 la quinta giusta (5P). Infatti, per M=2 quindi per M
E1 =
E2 =
2+1 2 2 + (2 + 1) − 2
=
2·2−1 2 2 + (2 · 2 − 1) − 2
�
=
�
3/2
3
�
3/2
3
�
Le frazioni 11 e 21 (unisono e ottava) aventi IC = 0 e IC = 1, sono ai limiti opposti delle curve dove intercettano le rette x = 1 e x = 2. Infatti, 11 si trova su E2 per x = 1 ed M = 1 E2 =
�
2−1 1 + (2 − 1) − 2
�
=
�
1 0
�
L’ottava, invece, 21 si trova su E1 per x = 2, infatti per M=1 � � � � 1+1 2 E1 = = 1 + (1 + 1) − 2 1 In realtà si possono trovare altri inviluppi secondari, come i due inviluppi ai contorni di 5P (figura 8.14). L’inviluppo tra 43 e 32 (E1a ) è dato dalle frazioni 43 , 75 , 10 13 16 7 , 9 , 11 ecc. quindi Ni+1 = Ni + 3 ed Mi+1 = Mi + 2,
214
8.3 La curva delle frazioni
Figura 8.14: Inviluppi secondari della curva delle frazioni
dove N1 = 4 ed M1 = 3 quindi, utilizzando un parametro a, N = 3a + 1 ed M = 2a + 1 con a = {1 . . . ∞}. Pertanto:
E1a =
3a + 1 2a + 1 (3a + 1) + (2a + 1) − 2
Mentre l’inviluppo della curva E2a da 53 a 32 è dato dal17 20 le frazioni 53 , 85 , 11 7 , 11 , 13 ecc. Utilizzando nuovamente il
215
8 Sintonie parametro a, N = 3a + 2 ed M = 2a + 1, quindi
E2a =
3a + 2 2a + 1 (3a + 2) + (2a + 1) − 2
L’intersezione tra E1 ed E1a è la 4P di 43 , mentre l’intersezione tra E2 ed E2a è la 6M di 53 . Allo stesso modo vi sono inviluppi secondari all’intorno di ciascun picco della curva delle frazioni comprese tra 1 e 2, nell’intervallo di ottava, ed anche all’intorno di ciascuno dei picchi degli inviluppi secondari ecc. Per esempio, possiamo trovare un inviluppo E1b tra 54 e 43
E1b =
(4a + 1) + (3a + 1) − 2
speculare all’inviluppo tra
E2b =
7 4
E1c = 216
e 53 , E2b
5a + 2 3a + 1 (5a + 2) + (3a + 1) − 2
Ma anche un inviluppo E1c tra
4a + 1 3a + 1
9 7
e
5 4
ed E2c tra
5a + 4 4a + 3 (5a + 4) + (4a + 3) − 2
12 7
e
7 4
8.3 La curva delle frazioni
E2c =
Vedi figura 8.15.
7a + 5 4a + 3 (7a + 5) + (4a + 3) − 2
Figura 8.15: Altri inviluppi secondari della curva delle frazioni
In generale, possiamo dire che all’intorno di ciascun picco di una frazione N/M , dove N = pN a + qN ed M = pM a + qM (con p, q ed a numeri interi e per a = 1), esiste un inviluppo di tipo iperbolico tale per cui per a → ∞ ⇒ N/M = pN /pM . Pertanto, un inviluppo E della curva della frazioni, da N1 /M1 all’asintoto N∞ /M∞ avrà equazione (a − 1) N∞ + N1 (a − 1) M∞ + M1 E= [(a − 1) N∞ + N1 ] + [(a − 1) M∞ + M1 ] − 2 dove per a = 1 la ratio è pari ad N1 /M1 mentre per a → ∞ la ratio è pari ad N∞ /M∞ . Per a = 0, la curva dell’inviluppo 217
8 Sintonie intercetta (N1 − N∞ )/(M1 /M∞ ) = qN /qM . In figura 8.16 sono mostrati gli inviluppi primari, alcuni secondari ed alcuni inviluppi terziari.
Figura 8.16: Ulteriori inviluppi della curva delle frazioni
Le frazioni del sistema a giusta intonazione si trovano comunque sui due inviluppi principali, (E1 , E2 ed E1a , E2a ), tranne la 4� di 45 32 che, di fatto, nell’armonia settimale è stata sostituita con la più sintonica 75 appartenente ad E1a . In particolare, tutte le consonanze perfette e imperfette, appartengono ad E1 (figura 8.17). Quest’analisi rivela dunque importanti proprietà fisiche e matematiche delle frazioni, legate direttamente all’indice di complessità razionale IC introdotto al Capitolo 5, che pertanto si rivela essere un buon indice di dissonanza di un intervallo armonico tra due toni puri.
218
8.3 La curva delle frazioni
Figura 8.17: Intervalli di giusta intonazione e curva delle frazioni
219
9 Geometrie musicali paralleli tra musica e geometria nel corso della storia Ipitagorica sono stati numerosi e anche molto complessi, dalla spirale quale espressione geometrica della comma pitago-
rico alle complesse interazioni tra musica e architettura del compositore Iannis Xenakis. Le interazioni tra le due discipline sono talmente importanti che molti ricercatori e studiosi, noti per lo più per il loro campo specifico, si interessarono anche di musica. Per esempio, Friedrich Johannes Kepler, il noto astronomo e matemico che definì le leggi che regolano il movimento dei pianeti, fu anche musicista e costruì un proprio temperamento. L’opera scientifica completa in cui descrisse le tre leggi oggi note come leggi di Keplero, si intitolava Harmonice Mundi (1619) come a ribadire le strette correlazioni tra musica, geometria e astronomia. D’altra parte, il concetto di «musica delle sfere» risale, nuovamente, a Pitagora. Ma il connubio tra geometria e musica non è solamente un ricordo del passato e non si limita al solo periodo classico. Abbiamo già infatti accennato a Iannis Xenakis, architetto e compositore di musica contemporanea, che studiò la spazialità tridimensionale del materiale sonoro usando concetti e formule matematiche e architettoniche, ma possiamo citare anche il saxofonista jazz John Coltrane, appassionato di astronomia, e le costruzioni geometrico-matematiche di alcune sue composizioni come il capolavoro Giant Steps.
221
9 Geometrie musicali
9.1 Musica e poligoni regolari Ci proponiamo qui di utilizzare semplici strumenti geometrici per visualizzare gli intervalli esprimibili in forma frazionaria e comprendere meglio i loro rapporti reciproci. Nella storia della musica, la circonferenza è stata più volte utilizzata come interpretazione geometrica dell’intervallo di ottava (soprattutto nella costruzione dei temperamenti). Infatti, si può affermare che il sistema musicale è periodico per ottave esattamente come le funzioni seno e coseno sono periodiche per 2π. Vi sono diversi modi utilizzati in matematica e geometria per indicare la misura degli angoli. Uno di questi modi è la definizione in radianti. In radianti, l’angolo giro di 360° misura 2π, l’angolo piatto di 180° è la metà corrispondente a π, mentre gli angoli di 90° (angolo retto) e di 270° misurano rispettivamente π2 e 32 π. Noi utilizzeremo la circonferenza come intervallo d’ottava e le assegneremo dunque il valore dell’angolo giro di 2π. Vedremo gli altri intervalli come vertici di poligoni inscritti nella circonferenza e utilizzeremo le forme geometriche derivanti per comprendere meglio i rapporti tra gli intervalli frazionari. Iniziamo dunque definendo matematicamente la circonferenza e i due intervalli di unisono e ottava. La funzione che descrive la circonferenza nel sistema cartesiano è x2 + y 2 = r 2 dove r è il raggio della circonferenza. Per semplicità di calcolo, utilizzeremo una circonferenza di raggio unitario. Dunque avremo:
222
9.1 Musica e poligoni regolari
x2 + y 2 = 1 In coordinate polari, equivale a: r=1 dove r è il raggio della circonferenza (figura 9.1).
Figura 9.1: Circonferenza di raggio unitario
Nelle funzioni seno e coseno, gli angoli in radianti si misurano in senso antiorario. L’angolo 0 ≡ 2π, corrisponde alle coordinate [x; y] = [1; 0], come mostrato in figura 9.2. Quindi, nello schema che utilizzeremo, unisono e ottava coincidono e misurano 2π (oppure 0, essendo la funzione periodica per ottava e dunque per 2π). Il primo intervallo che possiamo aggiungere, data la sua importanza, è quello di quinta giusta. Per calcolare le coordinate cartesiane dell’intervallo, esprimeremo il suo rapporto
223
9 Geometrie musicali
Figura 9.2: Unisono e ottava
in funzione di 2π, interpretando gli intervalli come angoli espressi in radianti, utilizzando la seguente formula: � � N N − 2π = 2π −1 θN/M = 2π M M
Abbiamo utilizzato questa formula per la trasformazione degli intervalli in angoli, perché le frazioni musicali entro l’ottava sono tutte comprese tra 1 e 2. Se avessimo semplicemente moltiplicato 2π per N/M avremmo ottenuto angoli N (o l’unità compresi tra 2π e 4π; sottraiamo dunque 2π a 2π M N 1 ad M ) per ottenere angoli compresi tra 0 e 2π (o frazioni con valore compreso tra 0 e 1). Le coordinate dell’intervallo sulla circonferenza saranno dunque esprimibili in funzione del seno e del coseno dell’an1 Dato
che, essendo le funzioni trigonometriche periodiche per 2π, un angolo θ = α+2π è equivalente ad α: θ = α+2π ≡ (α+2π)−2π = α.
224
9.1 Musica e poligoni regolari golo corrispondente, secondo le leggi della trigonometria: xN/M = cos θN/M yN/M = sin θN/M Quindi
� � [x; y]N/M = cos θN/M ; sin θN/M
L’intervallo di quinta giusta, che ha ratio 2), in radianti è: � � 3 θ3/2 = 2π −1 =π 2
3 2
(N = 3, M =
Dunque, l’intervallo di 5P corrisponde a π, l’angolo piatto di 180°. Le sue coordinate [x; y] saranno in funzione rispettivamente del coseno e del seno dell’angolo corrispondente (figura 9.3). Quindi: x3/2 = cos θ3/2 = cos π = −1 y3/2 = sin θ3/2 = sin π = 0 La 5P è esattamente a metà della circonferenza ed all’opposto di 1P (≡8P), sull’asse delle x, quindi il segmento 5P 1P è il diametro della circonferenza. La sua forma grafica è quindi compatibile con la sua importanza musicale e fisica. Anche nell’esperimento delle sintonie era infatti risultato un rapporto molto importante, il quale divide in due parti uguali l’intervallo di ottava. Infatti, la quinta giusta è l’intervallo a minor IC dopo l’ottava (3 + 2 − 2 = 3). Possiamo ora procedere a suddividere l’ottava in tre parti uguali e, con un ragionamento inverso, trovare a quali frazioni
225
9 Geometrie musicali
Figura 9.3: Quinta giusta: θ3/2 = π
corrispondono gli angoli θN/M = 13 2π = 23 π e θN/M = 23 2π = 4 3 π. Utilizzeremo pertanto una formula inversa, per risalire ad N/M a partire da θN/M . Questa formula è facilmente ricavabile dalla formula che esprimeva θN/M : θN/M + 2π N = M 2π Pertanto avremo: N = M
2 3π
8 + 2π π 4 = 3 = 2π 2π 3
4 10 π + 2π π 5 N = 3 = 3 = M 2π 2π 3 Dunque la quarta giusta ( 43 ) e la sesta maggiore ( 53 ) suddividono l’ottava in tre parti uguali. La 4P e la 6M so-
226
9.1 Musica e poligoni regolari no gli intervalli a minor IC dopo la quinta giusta infatti IC 4/3 = 4 + 3 − 2 = 5 ed IC 5/3 = 5 + 3 − 2 = 6. Quindi possiamo dire che θ4/3 =
2 π 3
4 π 3 Le coordinate per cui questi due angoli intercettano la circonferenza saranno (figura 9.4): � � � � 2 2 [x; y]4/3 = cos π; sin π = −0.5; 0.86 3 3 � � � � 4 4 [x; y]5/3 = cos π; sin π = −0.5; −0.86 3 3 θ5/3 =
Dunque gli intervalli di 4P e 6M formano con la 1P un triangolo equilatero inscritto nella circonferenza. Infatti O 1P, O 4P e O 6M sono uguali essendo raggi della circonferenza, � � pertanto i triangoli 1P O 4P, 1P� O 6M e 6M O 4P sono isosceli con angolo in O pari a 23 π e dunque angoli alla base di π6 . Quindi gli angoli del triangolo 1P� 4P 6M misurano π3 . Suddividiamo ora la circonferenza in quattro parti uguali, trovando a quali intervalli corrispondono le coordinate [0; 1] e [0; −1], quindi gli angoli π2 (90°) e 32 π (270°). Nel caso dunque di π2 avremo: N = M
π 2
5 + 2π π 5 = 2 = 2π 2π 4
Pertanto: θ5/4 =
π 2
227
9 Geometrie musicali
Figura 9.4: Quarta giusta e sesta maggiore
Quindi l’intervallo corrispondente a π2 è 54 , la terza maggiore, di coordinate [0; 1]. Per l’angolo 32 π avremo invece: 7 + 2π π 7 = 2 = 2π 2π 4 3 θ7/4 = π 2 Ritroviamo nuovamente la settima dell’armonia settimale, corripondente dunque a 32 π, la quale avrà pertanto coordinate [0; −1] (figura 9.5). Gli intervalli 11 , 54 , 32 , 74 (e 21 ) sono dunque la più semplice divisione dell’ottava (e della circonferenza, 2π) in quattro parti uguali. Dal punto di vista geometrico, questi quattro intervalli possono esser visti come vertici di un quadrato inscritto nella circonferenza. Infatti i diametri 1P 5P e 3M 7/4 sono ortogonali e sono anche le diagonali di 1P 3M 5P 7/4.
N = M
228
3 2π
9.1 Musica e poligoni regolari
Figura 9.5: Terza maggiore e settima minore settimale
Vediamo ora gli intervalli a denominatore 5: 65 (la 3m), 75 (il tritono settimale), 85 (la 6m) e 95 (la 7m). Saranno, intuitivamente, i vertici di un pentagono regolare inscritto nella circonferenza e la suddivideranno in 5 parti uguali. Per velocizzare i calcoli, utilizzeremo delle matrici di punti, lasciando al calcolatore il compito di derivare le coordinate e tracciare corde e semirette passanti per i punti. Dovremo dunque definire di volta in volta un parametro, contenente tutte le frazioni che ci interesserà visualizzare e un gruppo di punti di coordinate dipendenti dal parametro. Gli angoli corrispondenti alle frazioni di nostro interesse saranno: � � 2 6 θ6/5 = 2π −1 = π 5 5 � � 4 7 −1 = π θ7/5 = 2π 5 5 229
9 Geometrie musicali θ8/5 = 2π θ9/5 = 2π
�
�
�
8 −1 5
�
9 −1 5
=
6 π 5
=
8 π 5
Definiamo pertanto il parametro a5 contenente tutte le frazioni2 a denominatore 5: � � 1 6 7 8 9 2 ; ; ; ; ; a5 = 1 5 5 5 5 1 E il gruppo di punti determinati dalle coordinate calcolate in base a coseno e seno dell’angolo θN/M corrispondente: �
x y
�
= a5
�
cos (2π (a5 − 1)) sin (2π (a5 − 1))
�
Dunque gli intervalli a denominatore 5 (figura 9.6) suddividono l’ottava in cinque parti uguali. Così come possiamo costruire un triangolo equilatero con vertice in 1P, possiamo costruirne uno uguale ed opposto con vertice in 5P. Le coordinate dei due punti saranno esattamente speculari � � rispetto � a quelle di 4P e 6M dunque saranno � 0.5; 0.86 e 0.5; −0.86 . Gli angoli 23 π e 43 π dividevano in tre parti uguali l’angolo giro a partire da 2π, corrispondente alla 1P e possono dunque essere ottenuti sommando e sottraendo 2 3 π all’angolo 0 ≡ 2π. Possiamo dunque semplicemente calcolare i due θN/M speculari sommando e sottraendo 23 π alla 5P, quindi a π. 5 2 θN/M = π + π = π 3 3 2 Includiamo
230
anche l’ottava per “chiudere” il poligono.
9.1 Musica e poligoni regolari
Figura 9.6: Intervalli a denominatore 5
π 2 θN/M = π − π = 3 3 Possiamo ora ricavare N/M dei due intervalli corrispondenti 5 11 π + 2π π 11 N = 3 = 3 = M 2π 2π 6 N = M
π 3
7 + 2π π 7 = 3 = 2π 2π 6
Sono i due intervalli di 76 (il tono supermaggiore) e 11 6 che avevamo trovato grazie all’esperimento dello sweep, i quali formano un triangolo equilatero inscritto nella circonferenza, con “vertice” in 5P (figura 9.7). Gli intervalli a denominatore 3 e 6 ( 66 = 33 = 11 , 76 , 43 , 9 3 5 11 6 = 2 , 3 , 6 ) sono quindi i vertici di un esagono regolare, formato da due triangoli equilateri uguali e simmetrici
231
9 Geometrie musicali
Figura 9.7: Intervalli
11/6
e 7/6
rispetto all’origine O. Utilizzando quindi il parametro a6 e il gruppo di punti corrispondente � � 1 7 4 3 5 11 2 ; ; ; ; ; ; a6 = 1 6 3 2 3 6 1 � � � � x cos (2π (a6 − 1)) = y a sin (2π (a6 − 1)) 6
otteniamo l’esagono regolare inscritto nella circonferenza (figura 9.8). Gli intervalli a denominatore 7 dell’armonia settimale 87 , 97 , 10 11 12 13 7 , 7 , 7 e 7 suddividono invece l’ottava in 7 parti uguali; sono quindi i vertici dell’ettagono regolare inscritto nella circonferenza (figura 9.9). Definendo il parametro a7 e il gruppo di punti corrispondente: � � 1 8 9 10 11 12 13 2 a7 = ; ; ; ; ; ; ; 1 7 7 7 7 7 7 1 232
9.1 Musica e poligoni regolari
Figura 9.8: Esagono regolare
�
x y
�
= a7
�
cos (2π (a7 − 1)) sin (2π (a7 − 1))
�
Può anche essere utile visualizzare gli intervalli vertici dell’ottagono regolare, dato che 98 e 15 8 sono due intervalli di 13 giusta intonazione (la 2M e la 7M) e 11 8 e 8 sono stati più volte in passato utilizzati come sostituti della 4� e della 6m 13 di giusta intonazione. La 2M, 11 8 , 8 e la 7M formano un quadrato inscritto nella circonferenza, ruotato di π4 rispetto al quadrato formato 1P, 3M, 5P e 74 . Questi due gruppi di punti pertanto sono i vertici dell’ottagono regolare (figura 9.10). � � π 9 θ9/8 = 2π −1 = 8 4 � � 3 11 −1 = π θ11/8 = 2π 8 4 233
9 Geometrie musicali
Figura 9.9: Ettagono regolare
θ13/8 = 2π θ15/8 = 2π �
� �
�
13 −1 8
�
15 −1 8
=
5 π 4
=
7 π 4
1 9 5 11 3 13 7 15 2 ; ; ; ; ; ; ; ; 1 8 4 8 2 8 4 8 1 � � � � x cos (2π (a8 − 1)) = y a sin (2π (a8 − 1))
a8 =
�
8
Prima di passare all’analisi geometrica delle scale, riassumiamo tutti gli intervalli trovati in un solo grafico. Vi saranno dunque il diametro (1P-5P), il triangolo, il quadrato, il pentagono, l’esagono, l’eptagono e l’ottagono regolari (figura 9.11).
234
9.1 Musica e poligoni regolari
Figura 9.10: Ottagono regolare
Notiamo che le frazioni che definivano l’inviluppo primario E1 ed E2 della curva delle frazioni nel precedente capitolo, nella circonferenza corrispondono ai vertici dei poligoni regolari legati direttamente da una corda con il punto 1P (figura 9.12). Possiamo quindi visualizzare anche i due inviluppi E1 ed E2 adattando le equazioni alla circonferenza:
cos (2π (ratio − 1)) IC E= sin (2π (ratio − 1)) IC 235
9 Geometrie musicali
Figura 9.11: Poligoni regolari fino all’ottagono
Quindi E1 ed E2 corrisponderanno a
E1 = 236
�� a+2 −1 cos 2π a+1 (a + 2) + (a + 1) − 2 �� � � a+2 −1 sin 2π a+1 (a + 2) + (a + 1) − 2 �
�
9.1 Musica e poligoni regolari
Figura 9.12: Frazioni degli inviluppi primari E1 ed E2
E2 =
�� 2a + 1 −1 cos 2π a+1 (2a + 1) + (a + 1) − 2 � � �� 2a + 1 sin 2π −1 a+1 (2a + 1) + (a + 1) − 2 �
�
con a = {1 . . . ∞} (figura 9.13). I due inviluppi corrispondono alle curve che delimitano l’area cardiode al centro della circonferenza. Il punto di intercetta tra gli inviluppi cardiodi e le semirette con origine nel centro della circonferenza, definite in coordinate polari da θN/M = 2π
�
�
N −1 M
237
9 Geometrie musicali
Figura 9.13: Inviluppi E1 ed E2 sulla circonferenza
corrisponde al valore 1/IC dell’intervallo N/M : più l’intercetta è lontana dall’origine, più l’intervallo è consonante (basso IC ); più l’intercetta è vicina all’origine, più l’intervallo è dissonante (elevato IC ).
9.2 Geometria delle scale Nella precedente sezione abbiamo trovato tutti gli angoli e i poligoni corrispodenti a tutti gli intervalli di giusta intona45 zione, tranne la 2m (di 16 15 ) e la 4� (di 32 ) che sono in realtà, come sappiamo, derivati da rapporti interni alle scale maggiore e minore di giusta intonazione. Per comprendere quale sia la costruzione geometrica della scala di giusta intonazione, formiamo una matrice di punti e di rette passanti per l’origine, contenenti tutti gli intervalli della scala. Chiamiamo la
238
9.2 Geometria delle scale matrice g. g=
�
1 16 9 6 5 4 45 3 8 5 9 15 2 ; ; ; ; ; ; ; ; ; ; ; ; 1 15 8 5 4 3 32 2 5 3 5 8 1 � � � � cos (2π (g − 1)) x = sin (2π (g − 1)) y g
�
Possiamo anche facilmente definire le semirette con origine in O e formanti un angolo desiderato θ con l’asse delle x, grazie alle coordinate polari: θ = 2π (g − 1)
Figura 9.14: Scala di giusta intonazione
È evidente, come ci aspettavamo (figura 9.14), la notevole irregolarità del poligono corrispondente. Si potrebbe pensare che, data l’importanza sintonica delle costruzioni poligonali,
239
9 Geometrie musicali il modo più semplice e più efficace per equalizzare questa irregolarità della scala di giusta intonazione, volendo avere 12 note in una ottava, sia quello di costruire un dodecagono regolare. Allo scopo, creeremo la matrice j di 12 punti (più l’ottava) che suddividano la circonferenza 2π in dodici parti uguali di π6 (figura 9.15). � � 1 13 7 5 4 17 3 19 5 7 11 23 2 j= ; ; ; ; ; ; ; ; ; ; ; ; 1 12 6 4 3 12 2 12 3 4 6 12 1 � � � � x cos (2π (j − 1)) = y j sin (2π (j − 1)) θ = 2π (j − 1)
Figura 9.15: Suddivisione in 12 parti uguali
Troviamo alcuni intervalli già noti ed altri nuovi intervalli a denominatore 12. Nonostante la sua apparente regolarità
240
9.2 Geometria delle scale formale una scala così costruita, oltre all’elevato IC di molti degli intervalli che la compongono, sarebbe percepita come alquanto bizzarra. Il motivo è che la nostra percezione del pitch (l’altezza di un suono), non è lineare ma logaritmica. Non è tanto la differenza tra i due suoni che ne determina il pitch ma è il loro rapporto. Infatti, tornando ad analizzare la scala di giusta intonazione (figura 9.14) possiamo notare una maggiore densità di note tra 0 e π (tra 1P e 5P) rispetto alle note comprese tra π e 2π (tra 5P e 8P). Per comprendere meglio questo concetto è utile osservare come risultino graficamente gli intervalli definiti dal temperamento equabile (figura 9.16). Sappiamo che in questo temperamento tutti i semitoni sono uguali e sono pari a 21/12 dunque il parametro i contenente tutti i valori degli intervalli in una ottava sarà: i = {0; 1; 2; 3; 4; 5; 6; 7; 8; 9; 10; 11; 12} E la matrice di punti risulterà: �� � � � � � � cos �2π �2i/12 − 1�� x = y i cos 2π 2i/12 − 1
E le rette:
� � i θ = 2π 2 /12 − 1
Possiamo ora meglio comprendere il significato dell’espressione scala logaritmica. Infatti notiamo che i lati del poligono in temperamento equabile inscritto nella circonferenza aumentano regolarmente in lunghezza. Il rapporto infatti tra ciascuna corda e la successiva è 21/12 . Di fatto, un modo più adeguato della circonferenza, per tradurre geometricamente gli intervalli di ottava e la percezione del pitch, è la spirale. In particolare si tratta di una spi-
241
9 Geometrie musicali
Figura 9.16: Temperamento equabile
rale logaritmica in cui le distanze tra i bracci aumentano secondo una progressione geometrica. L’equazione della spirale logaritmica può anche essere espressa in forma parametrica: � � � t � x ab cos t = y abt sin t dove a e b controllano l’avvolgimento della spirale e t il numero di avvolgimenti in radianti. In particolare a indica l’intercetta iniziale sull’asse radiale, b è il parametro della progressione geometrica dell’avvolgimento e t = n2π, dove n indica il numero di avvolgimenti. Scegliamo come frequenza iniziale ν = 100 Hz. Si può ottenere una spirale logaritmica che intercetti l’asse delle x positivo per valori corrispondenti a 100 · 2n (ottave) ponendo: a = ν = 100
242
9.2 Geometria delle scale b2π = 2 ⇒ b =
√
2π
2 ≈ 1.116632
Visualizziamo dunque la spirale logaritmica corrispondente a 3 ottave. Il parametro t varierà da 0 a 8π; sarebbe, in realtà, sufficiente 6π per tre ottave dato che 3 · 2π = 6π, ma scegliamo 8π per avere un’idea di come prosegua la spirale (figura 9.17).
Figura 9.17: Spirale logaritmica per ν = 100
Vediamo infatti che la spirale intercetta l’asse radiale per tutte le frequenze pari a 100 · 2n ovvero per tutte le ottave di ν = 100 Hz. Essendo in scala logaritmica, dovremo modificare di conseguenza la formula per il calcolo degli angoli corrispondenti agli intervalli. Utilizzando le matrice g per gli intervalli di giusta intonazione � � 1 16 9 6 5 4 45 3 8 5 9 15 2 ; ; ; ; ; ; ; ; ; ; ; ; g= 1 15 8 5 4 3 32 2 5 3 5 8 1 243
9 Geometrie musicali gli angoli corrispondenti in scala logaritmica saranno θlog = 2π (log2 g)
Figura 9.18: Spirale logaritmica e scala di giusta intonazione
In figura 9.18 sono mostrate tre ottave in giusta intonazione a partire dalla frequenza ν = 100. Per non rendere il grafico illeggibile, sono state segnate solo le frequenze corrispondenti alla scala maggiore naturale. Ciascuna retta originante dal centro della spirale definisce un intervallo. Le intersezioni tra le rette e la spirale definiscono le note specifiche in ogni ottava. In temperamento equabile (figura 9.19), utilizzando la matrice i i = {0; 1; 2; 3; 4; 5; 6; 7; 8; 9; 10; 11; 12} 244
9.2 Geometria delle scale potremo calcolare gli angoli corrispondenti in scala logaritmica in questo modo � � i i θlog = 2π log2 2 /12 = 2π 12
Figura 9.19: Spirale logaritmica e temperamento equabile
Curiosamente, anche la coclea, organizzata tonopicamente su scala logaritmica, è avvolta a spirale! Nonostante l’eleganza geometrica del sistema a temperamento equabile (ste), esemplificata in maniera ancor più evidente dalla spirale logaritmica di figura 9.19, sappiamo che il temperamento equabile introduce notevoli errori d’intonazione, soprattutto per determinati intervalli. La geometria può ancora aiutarci a visualizzare meglio gli errori d’intonazione introdotti dal ste rispetto al sistema a giusta intonazione (sgi). Torniamo pertanto alla circonferenza e introduciamo nel grafico un fascio di semirette con origine in O = [0; 0] (il
245
9 Geometrie musicali centro della circonferenza) e passanti per i punti corrispondenti alle coordinate degli intervalli di giusta intonazione. Utilizzeremo nuovamente il parametro g per definire l’insieme degli intervalli di giusta intonazione: � � 1 16 9 6 5 4 45 3 8 5 9 15 2 ; ; ; ; ; ; ; ; ; ; ; ; g= 1 15 8 5 4 3 32 2 5 3 5 8 1 E il fascio di semirette definite dall’angolo θ θlog = 2π (g − 1) aggiungendo poi il poligono formato dagli intervalli del temperamento equabile, usando il parametro i i = {0; 1; 2; 3; 4; 5; 6; 7; 8; 9; 10; 11; 12} e il gruppo di punti corrispondente � � �� � � � � x cos �2π �2i/12 − 1�� = y i cos 2π 2i/12 − 1
L’errore d’intonazione è evidente su molti degli intervalli (figura 9.20), ma in particolare notiamo lo scarto sulle due terze e sulla sesta maggiore che essendo consonanti (e sintoniche) risentono maggiormente dell’imprecisione del ste. Abbiamo più volte sottolineato però che il temperamento equabile è molto più comodo rispetto al sistema a giusta intonazione, soprattutto nella costruzione di strumenti a corda. Di fatto, la tastiera di un basso o di una chitarra in sgi avrebbe una distribuzione non regolare dei tasti. Volendo visualizzarla graficamente, possiamo utilizzare nuovamente il parametro g e una serie di rette parallele all’asse y (figura 9.21 in alto). x=g
246
9.2 Geometria delle scale
Figura 9.20: Errori d’intonazione introdotti dal temperamento equabile
Questa tastiera sarebbe però accordata per un sola corda: ogni corda dovrebbe avere una propria distribuzione di tasti e sarebbe comunque utilizzabile per suonare in una sola tonalità, a meno di non rendere mobili i tasti e poter riaccordare l’intera tastiera (per ogni singola corda) ad ogni cambio di tonalità. Una tastiera moderna, costruita in temperamento equabile (figura 9.21 in basso), segue invece le proporzioni definite dal parametro i e dalle rette x = 2 /12 i
È sicuramente più semplice da costruire e può essere utilizzata su qualunque corda per qualunque tonalità, sebbene con errori d’intonazione variamente distribuiti su tutti gli intervalli.
247
9 Geometrie musicali
Figura 9.21: Tastiera in sgi (in alto) e ste (in basso)
9.3 Passi da gigante Abbiamo accennato all’inizio del capitolo ad una composizione del saxofonista jazz John Coltrane: Giant Steps. Con gli strumenti matematici e geometrici acquisiti, possiamo ora comprendere la complessità e l’eleganza formale di quest’opera. La partitura è di 16 battute ed è basata su tre tonalità: B maggiore, G maggiore e E� o D� maggiore (figura 9.22). Queste tre tonalità sono in mutuo rapporto di terza maggiore e quinta aumentata (o sesta minore, che in ste è omofona della quinta aumentata). Infatti il rivolto di una terza maggiore è una sesta minore, che in ste è omofona della quinta aumentata e, in temperamento equabile, due terze maggiori consecutive sono pari ad una quinta aumentata (24/12 · 24/12 = 28/12 ) mentre tre terze maggiori consecutive (o una quinta aumentata più una terza maggiore) sono un’ottava (24/12 · 24/12 · 24/12 = 2). In giu� 5 �3 � �2 = 125 sta intonazione non è così, infatti 54 = 25 16 e 4 64 . 248
9.3 Passi da gigante
Figura 9.22: Tonalità di Giant Steps
Per visualizzare dunque la costruzione geometrica di questo brano ci serviremo del temperamento equabile e, in particolare, utilizzeremo la circonferenza come rapporto d’ottava, suddividendola in dodici parti uguali in scala logaritmica. Con questi parametri, il rapporto geometrico fra le tre tonalità è pertanto un triangolo equilatero (figura 9.23 a sinistra). La composizione è suddivisa in tre sezioni, più una cadenza finale. Ogni sezione modula in tutte e tre le tonalità secondo lo schema 1. B → G → E� 2. G → E� → B 3. E� → G → B
→ E� 249
9 Geometrie musicali
Figura 9.23: 1P, 3M e 5� in ste e i “percorsi” di Giant Steps
Dal punto di vista geometrico, dunque, viene “percorso” il triangolo equilatero a partire da ciascuno dei suo vertici (figura 9.23 a destra). Il risultato è il ritorno alla tonalità iniziale di B. La cadenza finale in E� chiude il brano e prepara il nuovo chorus che riparte dalla prima sezione.
9.4 Periodicità e divisione in base 12 Vogliamo qui accennare ad una curiosità storica. Lo zodiaco è diviso in dodici case, l’anno è diviso in dodici mesi, il giorno è diviso in 24 (12 · 2) ore e le ore in 60 (12 · 5) minuti ecc. Le note musicali (occidentali) sono periodiche in base dodici. La divisione in base 12, soprattuto di eventi periodici, è storicamente molto antica. Deriva probabilmente da Sumeri
250
9.4 Periodicità e divisione in base 12 e Assiro-Babilonesi, che suddividevano il cerchio (e quindi anche lo zodiaco) in 12 parti e il giorno in 12 settori divisi a loro volta in due parti, complementariamente all’attuale sistema che divide il giorno in due parti (anti- e post-meridiana), suddivise a loro volta in 12 ore. La base 12 era anche utilizzata nel commercio e in varie unità di misura, dai Sumeri ma anche dai Romani (1 asse = 12 unciæ) e, ancora oggi, nei paesi anglosassoni (1 piede = 12 pollici; 1 pollice = 12 linee; 1 linea = 12 punti). Il motivo di questa suddivisione può essere legato al computo digitale, infatti ciascun dito è formato da tre falangi, dunque 3 · 4 = 12. Il pollice sarebbe stato usato come cursore per conteggi e divisioni. In realtà, vi è anche una spiegazione più matematica: il numero 12 ha una maggior quantità di divisori rispetto al numero 10. Infatti, 10 può essere diviso solamente per 2 e 5 (oltre che per 1 e 10) mentre 12 può essere diviso per 2, 3, 4 e 6 (oltre che per 1 e 12). Dal punto di vista commerciale e per eventi periodici, è più utile quindi poter dividere per 2, 3, 4 e 6 piuttosto che solamente per 2 e 5. La base 60 è ancora più vantaggiosa dal punto di vista dei divisori, perché 60 può essere diviso per tutti i primi sei numeri naturali 1, 2, 3, 4, 5 e 6 essendo, di fatto, uguale a 12 · 5. È quindi probabile che anche il sistema musicale, quale evento periodico per ottave, abbia subito nel corso della storia la medesima suddivisione in base 12.
251
9 Geometrie musicali
9.5 Triadi e triangoli In questa breve sezione approfondiremo alcune interessanti proprietà geometriche delle triadi. Conosciamo già il triangolo equilatero della triade 1P�4P�6M, che è una triade maggiore di 4P in secondo rivolto, infatti in C sarebbe C�F�A (5P�1P�3M di F). Analizziamo quindi più in dettaglio la triade maggiore 1P�3M�5P, il triangolo formato dagli intervalli 1 5 3 1 , 4 e 2 (figura 9.24).
Figura 9.24: Triangolo 1P� 3M 5P
Sappiamo già che l’angolo θ5/4 = π2 e l’angolo θ3/2 = π. I segmenti O 1P, O 3M e O 5P sono uguali essendo raggi della circonferenza. Dunque gli angoli α, β, γ e δ sono tutti uguali e misurano π4 . Inoltre le corde 1P 3M e 3M 5P sono uguali e l’angolo in 3M, β + γ, misura π2 . Dunque il triangolo 1P� 3M 5P è un triangolo rettangolo isoscele con base
252
9.5 Triadi e triangoli 5P 1P. Questa notevole proprietà geometrica è un’ulteriore conferma dell’importanza della triade maggiore nel sistema musicale europeo (e non solo europeo, essendo contemplata da diverse culture). La triade minore 1P�3m�5P ( 11 , 65 e 32 ) è decisamente meno interessante della triade maggiore (figura 9.25).
Figura 9.25: Triangolo 1P� 3m 5P
� 3m Sappiamo che l’angolo θ6/5 = 25 π, pertanto l’angolo 5P O 2 3 misurerà π − θ6/5 = π − 5 π = 5 π . I segmenti O 1P, O 3m e O 5P sono uguali essendo raggi della circonferenza, quindi � � i triangoli 1P O 3m e 3m O 5P sono equilateri e hanno come base la corda sottesa dai due angoli θ al centro della circonferenza. Sapendo che la somma degli angoli interni di un triangolo è pari a π e che α = β, possiamo facilmente
253
9 Geometrie musicali calcolare che α=β=
π − θ6/5 π − 25 π 3 = = π 2 2 10
Gli angoli γ e δ saranno invece pari a � � 2 π − π − θ6/5 θ6/5 π π γ=δ= = = 5 = 2 2 2 5 L’angolo in 3M β + γ è π2 essendo parte di un triangolo inscritto nella circonferenza, con il diametro come ipotenusa. Quindi il triangolo 1P� 3m 5P non gode di alcuna particolarità geometrica se non quella di essere un triangolo rettangolo.
� Figura 9.26: Triangolo 1P X 5P
È facilmente dimostrabile che in tutti triangoli con base 1P 5P, l’angolo β+γ = π2 , infatti dato un qualunque triangolo
254
9.5 Triadi e triangoli � 1P X 5P, dove X è un punto appartenente alla circonferenza (figura 9.26): π−θ π θ β= = − 2 2 2 π − (π − θ) θ γ= = 2 2 Pertanto: π π θ θ β+γ = − + = 2 2 2 2 Molto più interessante è la terna 1P�3m�6m, che è una triade maggiore di 6m in primo rivolto, infatti in C sarebbe C�E��A�, quindi 3M�5P�1P di A� (figura 9.27).
Figura 9.27: Triangolo 1P� 3m 6m
� 6m è Sappiamo che i raggi sono uguali e che l’angolo 3M O 6 2 4 � 1P pari a θ8/5 − θ6/5 = 5 π − 5 π = 5 π, e anche l’angolo 6m O 6 4 è pari a 2π − θ8/5 = 2π − 5 π = 5 π. Pertanto: α 1 = α2 =
π − 25 π 3 = π 2 10
255
9 Geometrie musicali β 1 = β2 = γ 1 = γ 2 =
π − 45 π π = 2 10
Quindi: α 1 + β 1 = α2 + γ 2 = β 2 + γ1 = 2
π 2 3 π+ = π 10 10 5 π π = 10 5
Dunque il triangolo 1P� 3m 6m è un triangolo aureo. Infatti è un triangolo isoscele la cui base è un lato del pentagono regolare 1P�3m� 75 �6m�7m e i cui lati sono diagonali congiungenti il vertice opposto (figura 9.27). Ultima terna di un certo interesse è 1P� 76 �5P (figura 9.28). Sappiamo già che l’angolo β + γ = π2 .
7 � Figura 9.28: Triangolo 1P 6 5P
256
9.6 Le curve di Lissajous In questo caso avremo anche che α=β=
π− 2
π 3
=
π 3
� Quindi il triangolo 1P O 76 è una triangolo equilatero. L’angolo γ è facilmente calcolabile γ=δ=
π π π − = 2 3 6
Scopriamo così un’ulteriore particolarità dell’antico tono 7 � supermaggiore di 7 : il triangolo 1P 5P è un triangolo ret6
6
tangolo, metà di un triangolo equilatero.
9.6 Le curve di Lissajous È doveroso un accenno alle curve o figure di Lissajous. Studiate per primo dall’astronomo americano Nathaniel Bowditch (infatti sono anche note come figure di Bowditch) nei primi dell’ottocento e perfezionate poi a metà dell’ottocento dal fisico e matematico francese Jean Antoine Lissajous, sono linee ondulate che si ottengono da uno strumento apposito chiamato Armonografo. Un armonografo, nella sua più tradizionale forma, è costituito da due diapason (tuning forks) posizionati ortogonalmente l’uno rispetto all’altro e sui cui rebbi sono posti degli specchietti. Quando lo specchietto del primo diapason è raggiunto da un raggio luminoso, proietta la vibrazione del rebbo sullo specchietto del secondo diapason che a sua volta proietta il risultato (attraverso una lente) su di uno schermo. Quello che viene in realtà proiettato è un punto luminoso che, muovendosi ad elevata velocità, forma delle linee curve, che sono le figure di Lissajous (figura 9.29).
257
9 Geometrie musicali
Figura 9.29: Schema di un Armonografo
Le figure di Lissajous sono ancora oggi utilizzate, sebbene computerizzate e proiettate sullo schermo di un oscillografo, in diversi campi quali per esempio la fisica e l’astronomia. L’interesse per queste curve dal punto di vista musicale, nasce dal fatto che sono molto sensibili al rapporto tra le due frequenze. In particolare, se le frequenze sono in rapporto semplice (basso IC ), anche la curva di Lissajous corrispondente è semplice. Dal punto di vista matematico, le figure di Lissajous sono un sistema di due equazioni parametriche corrispondenti a due moti sinusoidali ortogonali: x = Ax sin (ωx t + φx ) y = Ay sin (ωy t + φy ) dove t = 0 . . . 2π
258
9.6 Le curve di Lissajous Ax e Ay sono le ampiezze delle due onde, φx e φy sono le fasi, ωx e ωy sono le velocità angolari o pulsazioni delle due onde. La velocità angolare è direttamente proporzionale alla frequenza e inversamente proporzionale al periodo: ω = 2πν =
2π T
Pertanto, chiamando le due frequenze νx e νy tali per cui νy =
N νx + ε M
possiamo riscrivere le equazioni parametriche in funzione di νx e νy , sapendo che
Dunque:
ωx = 2πνx � � N νy + ε ωy = 2π M x = Ax sin (2πνx t + φx ) � � � � N y = Ay sin 2π νy + ε t + φy M
Per facilità di calcolo, porremo Ax = Ay = 1 e, almeno inizialmente, φx = φy = 0. La figura di Lissajous per l’intervallo di unisono è un cerchio. Poniamo νx = 100 Hz (figura 9.30 a sinistra). L’introduzione di un errore, anche minimo, provoca un cambiamento radicale nella figura di Lissajous. Poniamo, per esempio, ε = 0.2 Hz (figura 9.30 a destra). L’introduzione dell’errore ha modificato il pattern di oscillazione dei due moti ortogonali e dunque la forma della curva corrispondente.
259
9 Geometrie musicali
Figura 9.30: Figura di Lissajous per l’unisono perfetto (a sinistra) e con errore ε = 0.2 Hz (a destra)
Vediamo la curva dell’intervallo di ottava. Poniamo dunque νx = 100 ed N = 2, M = 1 con ε = 0 (figura 9.31 a sinistra). L’ottava è caratterizzata da una figura a otto. Notiamo che i ventri orizzontali corrispondono ad N (= 2) e i ventri verticali ad M (infatti è uno) indipendentemente dalla frequenza. Anche in questo caso l’introduzione di un minimo errore modifica la figura. Poniamo per esempio ε = 0.35 Hz (figura 9.31 a destra). Alcune curve di Lissajous sono apparentemente “aperte” e paiono non comportarsi come “nodi” chiusi. Per esempio, la figura di Lissajous per la quinta giusta (figura 9.32 a sinistra). In realtà, tutte le figure di Lissajous sono curve chiuse ma, a seconda della differenza di fase tra i due moti ortogonali, possono apparire come “aperte”. Infatti si descrivono due forme fondamentali per ogni curva di Lissajous, la forma aperta e la forma chiusa, più un insieme continuo di forme inter-
260
9.6 Le curve di Lissajous
Figura 9.31: Figura di Lissajous per l’ottava perfetta (a sinistra) e con errore ε = 0.35 Hz (a destra)
medie. Introduciamo una lieve differenza di fase nelle due π (figura 9.32 a destra). Vediamo che onde, ponendo φy = 60 la forma ora è chiusa. In realtà era chiusa anche precedentemente, quando le due fasi erano uguali e pari a zero, ma i due “cappi” del nodo, rivolgendosi su stessi, sembravano spezzare la curva. La curva di Lissajous della quinta giusta, diventa simmetrica per ∆φ = π4 (figura 9.33). Anche in questo caso, i ventri orizzontali corrispondono ad N e i ventri verticali ad M . Questo è valido per qualunque frazione N/M che descriva il rapporto tra le due frequenze. Vediamo ora una panoramica di tutti gli intervalli di giusta intonazione in forma chiusa e con ε = 0 Hz o ε = 0.4 Hz. Aggiungiamo anche 24/12 e 27/12 , la terza maggiore e la quinta giusta in temperamento equabile, senza errore (ε = 0), come esemplificazione dell’errore d’intonazione del ste.
261
9 Geometrie musicali
Figura 9.32: Figura di Lissajous per la quinta giusta in forma aperta (a sinistra) e chiusa (a destra)
Figura 9.33: Figura di Lissajous per la quinta giusta in forma chiusa simmetrica
262
9.6 Le curve di Lissajous
Figura 9.34: Figure di Lissajous per gli intervalli sgi
263
10 Accordi stonati questo capitolo affronteremo una prima analisi delle infra tre frequenze, definibili come terne di suoIninterazioni puri, concentrando l’attenzione sugli effetti degli errori d’intonazione. I battimenti bcs generati da tre frequenze possono essere di diverso tipo e, in determinati casi, hanno una particolare affinità con la modulazione di ampiezza (am) nota nel mondo delle telecomunicazioni. Useremo quindi una terminologia modificata ad hoc, appartenente alla fisica delle onde in telecomunicazione. Per questo, non chiameremo più le frequenze con un numero ordinale, come abbiamo fatto finora, ma con un aggettivo che ne identifichi la posizione. νL
la frequenza più bassa (lower frequency)
νC
la frequenza centrale (central frequency)
νU
la frequenza più alta (upper frequency)
quindi νL < νC < νU , dove νC =
N νL + ε M
νU =
J νL K
265
10 Accordi stonati con N, M, J, K ∈ N
ε∈Q
Manterremo dunque costanti gli estremi νL e νU e introdurremo l’errore ε sulla frequenze centrale νC . Chiameremo banda laterale inferiore (lsb, lower side band ) e rapporto inferiore (lr, lower ratio) rispettivamente la differenza e il rapporto tra νC e νL LSB = νC − νL = LR =
νC = νL
N ν L + ε − νL M
N M νL
+ε ε N + = νL M νL
banda laterale superiore (usb, upper side band ) e rapporto superiore (ur, upper ratio) rispettivamente la differenza e il rapporto tra νU e νC USB = νU − νC = UR =
νU = νC
J K νL N νL −M ε M
J N νL − νL − ε K M =
JM νL N KνL + M Kε
Chiameremo inoltre larghezza di banda (bw, band width) e rapporto di banda (br, band ratio) rispettivamente la differenza e il rapporto tra νU e νL . BW = νU − νL = BR =
J νL − νL K
J νL νU J = K = νL νL K
Avremo inoltre una banda interna o nascosta (hidden band, hb) e un rapporto interno o nascosto (hidden
266
10.1 Battimenti primari ratio, hr) che saranno rispettivamente la differenza e il rapporto tra la usb e la lsb. HB = USB − LSB = νU + νL − 2νC
ν U − νC USB = LSB νC − νL Dunque le frequenze e le loro relazioni si presenteranno come nell’esempio di figura 10.1 (che è per USB > LSB). HR =
Figura 10.1: Frequenze, bande e rapporti
Chiameremo inoltre B le frequenze dei battimenti primari e ζ le frequenze dei battimenti da consoanza stonata (per non confonderli con i bcs per due toni, chiamati β).
10.1 Battimenti primari Vediamo innanzitutto i possibili battimenti primari:
267
10 Accordi stonati 1. Battimento primario tra νC e νL . In questo caso il battimento è un semplice battimento primario, risultato della differenza tra le prime due frequenze, dunque una banda laterale inferiore (lsb) minore di 20 Hz. 2. Battimento primario tra νC e νU . Anche in questo caso avremo un semplice battimento primario tra la frequenza centrale e la superiore, dunque una banda laterale superiore (usb) minore di 20 Hz 3. Battimento primario tra νL e νU . Avremo una larghezza di banda (bw) minore di 20 Hz e dunque anche una lsb e una usb minori di 20 Hz. Il terzo caso è decisamente il più interessante. Avremo più battimenti primari in competizione tra loro. Come risultato (supponendo che le frequenze abbiano tutte la stessa ampiezza) otterremo un battimento primario pari al valore della larghezza di banda bw, modulato (in modo più evidente) da un inviluppo secondario, ovvero da un profilo superiore e inferiore, pari alla minore differenza tra le frequenze o tra le bande laterali, usb ed lsb. Se per esempio prendiamo una terna 309�310�320 Hz, otterremo un battimento primario pari a BW = 320 − 309 = 11 Hz, modulato da un inviluppo secondario pari a LSB = νC − νL = 310 − 309 = 1 Hz, che è appunto la differenza minore in questa terna (figura 10.2). Ma se per esempio scegliamo una terna 301�310�320 Hz, otterremo sempre un battimento primario di BW = 310 − 301 = 19 Hz, ma sarà modulato nel suo inviluppo più esterno dalla banda nascosta HB = USB − LSB = 320 − 310 − (310 − 301) = 1 Hz. In realtà nel suo profilo interno è pos268
10.1 Battimenti primari
Figura 10.2: Terna 309�310�320 Hz
sibile riconoscere anche le due bande laterali di 10 e 9 Hz, intermodulate (figura 10.3). Dunque il particolare caso di una bw minore di 20 Hz risulta molto interessante. Infatti avremo un battimento primario di frequenza pari a bw, e una serie di battimenti che chiameremo impropriamente secondari (visto che sono comunque dovuti a interferenza tra frequenze con differenza minore di 20 Hz), alcuni dei quali ne descriveranno più efficacemente l’inviluppo secondario o esterno e dunque anche il battimento
269
10 Accordi stonati
Figura 10.3: Terna 301�310�320 Hz
relativo. Questo caso particolare introduce nuove possibilità di applicazioni artistiche degli errori d’intonazione. Per ora, notiamo che potremmo avere una terna con BW < 20 Hz e LSB = USB. In questo caso, avremo una terna particolarmente simmetrica e un battimento primario pari a B = BW e altri due battimenti “secondari” (che chiameremo b) pari a b = USB = LSB che saranno esattamente uguali a B/2, infatti BW = USB + LSB e B = BW = b + b = 2b. Osserveremo quindi B picchi totali in un secondo, di cui me-
270
10.1 Battimenti primari tà (b = B/2) di ampiezza pari a 3A (dove A è l’ampiezza delle tre onde componente, che sono dunque in questo caso considerate di medesima ampiezza) e metà di ampiezza pari ad A. Avremo pertanto un’area di inviluppo della ψsum data dall’interesezione delle aree degli inviluppi dei due battimenti di frequenza b. Una terna di questo tipo può essere, per esempio, 304�310�316 di cui in figura 10.4 sono mostrati lo schema e l’onda ψsum .
Figura 10.4: Terna 304�310�316
271
10 Accordi stonati Notiamo infatti, B = BW = 316 − 304 = 12 picchi totali, di cui b = USB = 316 − 310 = LSB = 310 − 304 = 6 di ampiezza tripla rispetto agli altri 6.
10.2 Sintonie ed apotonie negli accordi Per la trattazione dei bcs negli accordi a tre note (tre suoni puri) utilizzeremo i termini sintonia per indicare una terna senza errori d’intonazione ed apotonia per indicare una terna con errori d’intonazione. In questa sede ci occuperemo solamente di particolari sintonie che chiameremo a banda doppia unisona (unidsbs, unison double side band sintony). Le sintonie a banda doppia unisona (unidsbs) sono le più importanti dal punto di vista musicale. In queste sintonie le due bande usb e lsb sono tra di loro all’unisono. Condizioni LSB = USB quindi HB = 0 e HR = 1 BW = 2USB = 2LSB È una delle sintonie più importanti in assoluto. Le terne della scala di giusta intonazione che godono di questa proprietà, hanno un ruolo predominante in tutto il sistema musicale europeo (e non solo).
272
10.2 Sintonie ed apotonie negli accordi
Figura 10.5: Sintonie a banda doppia unisona (unidsbs)
LSB = USB = νL è condizione sufficiente e necessaria a definire la terna di suoni armonici; infatti in questo caso νC = νL + LSB = 2νL e, dato che BW = 2USB = 2USB = 2νL allora νU = νL + BW = 3νL La loro somma è un suono che “si avvicina” a un suono reale e, in sostanza, ogni suono musicale reale, che dunque contenga armonici, gode di questa proprietà tra le sue onde componenti: le bande laterali sono tutte pari a νL in quanto differenza tra un armonico nνL e il precedente (n − 1) νL nνL − (n − 1)νL = νL 273
10 Accordi stonati È forse questo il motivo del fenomeno chiamato rintracciamento della fondamentale. Si ottiene eliminando o mascherando l’armonico fondamentale di un suono reale. La frequenza percepita è comunque pari alla fondamentale, anche se non è più presente nel suono. In realtà, è presente come banda laterale tra tutti gli armonici contigui. Ma USB = LSB non è solo un attributo degli armonici. Se poniamo infatti USB = LSB �= νL
otteniamo tutta una serie di interessanti possibilità che ci faranno comprendere ancora più a fondo il concetto di consonanza musicale, sia perfetta che imperfetta. Iniziamo dunque a derivare le regole delle unidsbs partendo dalle condizioni. In particolare, mantenendo costante la bw e modificando la frequenza centrale νC , deriveremo N ed M dati J e K ed anche lr e ur dati br e bw. Sappiamo che LSB = USB, dunque sviluppiamo questa uguaglianza, sostituendo ad lsb e usb le definizioni in funzione di νL e ponendo ε = 0: J N N ν L − νL = νL − νL M K M Dato che νL comparirà sempre in tutti i termini dei rapporti, possiamo per ora sbarazzarcene (almeno finchè ε = 0) e lavorare solo sui parametri N , M , J e K. Dunque: J N N −1= − M K M Da cui possiamo ricavare N ed M in funzione di J e K: J +K N = M 2K
274
10.3 Terne giuste uniDSBS
10.3 Terne giuste uniDSBS La più importante terna della scala di giusta intonazione che gode di questa proprietà è 1P�5P�8P corrispondente alle frazioni 11 � 32 � 21 (figura 10.6), dove J e K sono 2 e 1; infatti: J 2 = K 1 N J +K 2+1 3 = = = M 2K 2·1 2
Scopriamo quindi che nella terna 1P�5P�8P vi sono due bande laterali unisone e che dunque la 1P e la 8P sono perfettamente simmetriche rispetto alla 5P. In questo caso, dato che 3 νL LSB = νC − νL = νL − νL = 2 2 3 νL USB = νU − νC = 2νL − νL = 2 2 e che
1 3 νL νC = · νL = 3 3 2 2
1 νL νU = · 2νL = 4 4 2 è facilmente derivabile che LSB = USB =
νC νU νL = = 2 3 4
La terna 1P�5P�8P è quindi in realtà una serie di quattro armonici, il più basso dei quali è dato dalle frequenze sintoniche delle bande laterali, che saranno dunque in realtà la
275
10 Accordi stonati frequenza fondamentale della terna. Questa terna ha un’altra importante proprietà interessante; dato che νU = 2νL allora BW = νU − νL = 2νL − νL = νL
Dunque la banda bw è all’unisono con νL .
Figura 10.6: Terna 1P�5P�3M
Sappiamo già dal Capitolo 9 che questa terna gode di particolari proprietà geometriche, infatti 1P 5P e 5P 8P sono diametri della circonferenza sull’asse radiale. Pertanto 1P�5P�8P suddivide in due parti uguali la circonferenza di 2π. Un’altra terna importante in cui LSB = USB è 1P�3M�5P (fig 10.7): la triade maggiore. In quest’altro caso particolare dato che 5 νL LSB = νC − νL = νL − νL = 4 4 3 5 νL USB = νU − νC = νL − νL = 2 4 4 276
10.3 Terne giuste uniDSBS e che
1 5 νL νC = · νL = 5 5 4 4 1 3 νL νU = · νL = 6 6 2 4
ne consegue che LSB = USB =
νL νC νU = = 4 5 6
È dunque strettamente imparentata con la terna precedente. Scopriamo che anche in questo caso la 3M è perfettamente al centro della bw delimitata dalla 1P e dalla 5P.
Figura 10.7: Terna 1P�3M�5P
Inoltre, dato che BW = 2LSB = 2USB possiamo dire che BW =
νL 2
277
10 Accordi stonati Dunque le due bande laterali (sb in figura 10.7) sono l’armonico fondamentale di un suono con sei armonici, escluso il terzo. Per esempio, con νL = 100 Hz avremo (vedi figura 10.8) 100 = 25 Hz SB = 4 BW = 2SB = 2 · 25 = 50 Hz νL = 100 Hz νC =
5 5 νL = · 100 = 125 Hz 4 4
νU =
3 3 νL = · 100 = 150 Hz 2 2
Figura 10.8: Terna 100�125�150
Vi sono altre due terne, comprese nell’intervallo di ottava, che soddisfano questi criteri. Una è la terna 1P�4P�6M (fig 10.9). Abbiamo già parlato delle proprietà particolari dell’intervallo di quarta giusta, ma ora scopriamo un’altra
278
10.3 Terne giuste uniDSBS caratteristica importante. Divide esattamente a metà la bw formata da 1P�6M. In questo caso, dato che LSB = νC − νL = USB = νU − νC =
4 νL νL − νL = 3 3 5 4 νL νL − νL = 3 3 3
e che
νC 1 4 νL = · νL = 4 4 3 3 1 5 νL νU = · νL = 5 5 2 3 possiamo facilmente derivare che USB = LSB =
νL νC νU = = 3 4 5
È quasi una successione armonica. Anzi... si potrebbe dire che è proprio una successione armonica dato che BW = 2USB = 2LSB Le bande laterali sono la frequenza fondamentale, la bw (che è la loro somma) è il secondo armonico e le tre frequenze νL , νC e νU sono il III, il IV e il V. L’ultima terna entro l’ottava è 1P�2M�3M composta dalle frazioni 11 � 98 � 54 , infatti LSB = USB =
νL 8
La sintonia di questa terna sarebbe però valida solo nel caso in cui la 2M fosse al di sopra del limite di banda critica e del limite di battimento.
279
10 Accordi stonati
Figura 10.9: Terna 1P�4P�6M
Se sorpassiamo l’ottava e ci spingiamo fino al limite di due ottave troviamo altre due terne interessanti, tra cui la prima è 1P�8P�12P (fig 10.10 a sinistra). La 12P altro non è che la 5P un’ottava sopra ed ha dunque ratio 2 · 32 = 3. Questa terna è evidentemente molto simile alla terna 1�5P�8P, ma in questo caso è la 8P a trovarsi esattamente al centro della BW. Se analizziamo più a fondo ci accorgeremo che USB = LSB = νL BW = 2USB = 2LSB =2νL = νC e che pertanto la frequenza inferiore è pari alle bande laterali e la frequenza centrale è pari alla bw. L’ultima terna di cui ci occuperemo in questa sezione è 1P�10M�15P (fig 10.10 a destra), dove la 10M è la 3M un’ottava sopra, dunque 2 · 54 = 52 e la 15P altro non è che la 1P due ottave sopra, di ratio 4. La 10M divide esattamente a metà la bw. In questo caso però, USB = LSB > νL
280
10.4 Modulazione d’ampiezza e uniDSBS infatti
5 3 νL − νL = νL 2 2 5 3 USB = νU − νC = 4νL − νL = νL 2 2 BW = 2LSB = 2USB =3νL LSB = νC − νL =
La frequenza delle bande laterali è pari dunque alla 5P e quindi la bw, essendo il doppio, è la 12P (la stessa 5P un’ottava più acuta).
Figura 10.10: Terne 1P�8P�12P (a sinistra) e 1P�10M�15P (a destra)
10.4 Modulazione d’ampiezza e uniDSBS Prima di passare all’analisi dei bcs da errore d’intonazione, facciamo notare che la unidsbs è esattamente identica alla modulazione d’ampiezza (am) usata in telecomunicazione. Sappiamo infatti dal Capitolo 7 che un’onda somma di tre
281
10 Accordi stonati frequenze può anche essere vista come una portante pari alla media aritmetica delle frequenze inferiore e superiore, modulata in ampiezza dal messaggio. Nelle unidsbs, dato che la frequenza centrale si trova esattamente a metà della larghezza di banda, possiamo dire che νC è la portante. Infatti: ν C = νL +
2νL + νU − νL νU + νL BW νU − νL = νL + = = 2 2 2 2
Pertanto possiamo affermare che: ψsum = sin (2πνL t) + sin (2πνC t) + sin (2πνU t) ψsignal = [1 + 2 cos (2πνM t)] · sin (2πνC t) dove νM =
ν U − νL 2
Nel caso della unidsbs, dato che USB = LSB =
BW 2
BW = νU − νL e quindi νM =
BW = USB = LSB 2
ne consengue che νM il messaggio è pari alle bandi laterali (di cui indicheremo il valore come νSB ) e che la frequenza centrale è la portante (figura 10.11). ψsignal = [1 + 2 cos (2πνSB t)] · sin (2πνC t) 282
10.5 Errori sulle terne uniDSBS
Figura 10.11: Modualzione d’ampiezza e unidsbs
Dunque la unidsbs è una modulazione in ampiezza a banda doppia e portante intera, a differenza del caso visto nel Capitolo 7 che, essendo riferito a due sole frequenze componente, era a portante soppressa. In realtà in telecomunicazione l’ampiezza del messaggio νM deve essere minore di 1 altrimenti si assiste al fenomeno della sovramodulazione per cui la forma d’onda non è più una rappresentazione attendibile del segnale modulato (il messaggio) anche a causa dell’inversione di fase dell’onda. Pertanto, nel caso di tre suoni puri con medesima ampiezza, possiamo dire che l’onda è in sovramodulazione essendo l’ampiezza di νM pari a 2.
10.5 Errori sulle terne uniDSBS Ora che abbiamo analizzato le speciali proprietà delle terne unidsbs del sistema di giusta intonazione, possiamo reintrodurre l’errore ε nelle formule e prevedere i battimenti secon-
283
10 Accordi stonati dari che questo errore comporterà. Per comodità, deriviamo anche J e K in funzione di N ed M , con ε = 0: 2N − M J = M K quindi J = 2N − M K=M
Dunque, sviluppando la formula della hb, possiamo dire che HB = USB − LSB = νU +νL −2νC =
J N νL +νL −2 νL −2ε = K M
JM + KM − 2KN νL − 2ε KM e quindi, sostituendo J e K, in funzione di N ed M =
HB =
(2N − M ) M + M · M − 2M N νL − 2ε = M ·M
2N M − M 2 + M 2 − 2M N 0 νL − 2ε = 2 νL − 2ε = −2ε M2 M Quindi il modulo della hb determinerà la frequenza di ζ, il bcs dovuto all’errore ε, che sarà dunque =
ζ = |HB| = |−2ε| Avremo, anziché una doppia banda sintonica, una coppia di bande laterali che chiameremo apotoniche il cui “battimento primario” determinerà l’inviluppo e i bcs dell’onda somma ψsum . Dal punto di vista della modulazione d’ampiezza infatti, la frequenza centrale νC non corrisponde più alla portante.
284
10.5 Errori sulle terne uniDSBS Dobbiamo ora notare una cosa molto importante. Nonostante abbiamo scoperto che nel sistema a giusta intonazione esistono terne che soddisfano le condizioni per le unidsbs, ce ne sono invece alcune che contengono un ε connaturato alle ratio di giusta intonazione. Prendiamo per esempio la terna 1P�3m�4�. La 3m è 65 e la 4� è 45 32 . Se calcoliamo la hb sapremo a quanto ammonta l’eventuale errore di intonazione sulla unidsbs. HB = νU + νL − 2νC =
45 6 νL + νL − 2 · νL = 32 5
225νL + 160νL − 384νL 1 = νL 160 160 Dunque abbiamo un errore ε connaturato alla terna e pari alla metà della hb; infatti, dato che HB = −2ε =
ε=−
1 HB =− νL 2 320
Il modulo della hb ci darà la frequenza ζ del bcs in funzione di νL . � � � 1 � ζ = |HB| = �� νL �� 160
Se dunque, per semplicità di calcolo, prendiamo νL = 2 · 160 = 320 Hz, dovremmo trovare un battimento pari a 2 Hz. Avremo dunque una terna 320�384�450 (figura 10.12). Vediamo infatti un battimento di 2 Hz piuttosto evidente, ma notiamo altri inviluppi secondari intermodulati nei profili più interni dell’onda. Se sviluppassimo tutti i calcoli troveremmo che LSB = 64 =
320 384 450 = = 5 6 7.03125
285
10 Accordi stonati
Figura 10.12: Terna 320�384�350
quindi
νL νC νU = ≈ 5 6 7 Ecco dunque il motivo per cui vediamo altri battimenti: si tratta di un altro errore connaturato alla ratio, dato che νU non è perfettamente il VII armonico della lsb e quindi è presente un errore d’intonazione tra la lsb e νU . Non ci occuperemo in questa trattazione di queste ulteriori sintonie e delle apotonie derivate dagli errori di intonazione. Un’altra terna del sgi che contiene un ε connaturato sulla unidsbs coinvolge nuovamente la 4� ed è 1P�4��7m; la ratio della 7m è 95 . Calcoliamo dunqe la hb e scopriamo l’errore di intonazione in funzione di νL . LSB =
HB = νU + νL − 2νC =
288 + 160 − 450 1 νL = − νL 160 80
Dunque avremo un battimento ζ � � � 1 � ζ = |HB| = ��− νL �� 80 286
10.5 Errori sulle terne uniDSBS esattamente doppio rispetto al caso precedente e un errore ε pari alla metà, connaturato alla ratio del SGI. Prendiamo per esempio una terna 320�450�576. Ci aspettiamo di avere un bcs pari ad HB = 320/80 = 4 Hz (figura 10.13).
Figura 10.13: Terna 320�450�576
Il battimento da consonanza stonata è ora qui decisamente evidente e non notiamo nessun altro inviluppo secondario che non sia trascurabile. Possiamo quindi affermare che in questo caso è proprio unicamente l’errore ε sulla sintonia unidsbs a causare il bcs di frequenza ζ. Nessun’altra terna del sgi contiene errori connaturati rilevanti o proprietà particolari relativamente alla sintonia unidsbs. Possiamo però calcolare quale sia l’effetto sull’inviluppo secondario dell’onda somma introdotto dal Sistema a Temperamento Equabile (ste) sull’importante terna 1P�3M�5P. Avremo sia un errore sulla 3M che sulla 5P. Possiamo considerare inizialmente solo l’errore sulla 3M e mantenere la 5P di giusta intonazione. La 3M del ste ha ratio pari a 24/12 .
287
10 Accordi stonati Calcoliamo quindi la hb in funzione di νL : 3 4 νL + νL − 2 · 2 /12 νL = 2 � � 5 + 23/2 3 4 + 1 − 2 · 2 /12 νL = νL = 2 2
HB = νU + νL − 2νC =
Se dunque prendiamo come 1P un A4 a 440 Hz otterremo un battimento ζ pari a (figura 10.14 in alto): � � � � 5 + 23/2 · 440�� ≈ 8.7305 ζ = �� 2
Un battimento decisamente rilevante, soprattutto se lo confrontiamo con l’onda somma di sgi, senza errori di intonazione (figura 10.14 in basso). Se ora introduciamo anche l’errore sulla quinta giusta, noteremo una ulteriore modulazione dell’onda. La ratio della quinta giusta nel ste è la radice dodicesima di 7. Vediamo dunque prima qual è la differenza tra 32 e 27/12 . 3 7 − 2 /12 ≈ 0.001693 2 e calcoliamo anche l’errore di intonazione in Hz, prodotto dalla 5P del ste della frequenza esempio, A4 di 440 Hz, rispetto a quella del sgi � � 3 7/12 −2 440 ≈ 0.744886 Hz ε= 2 Dunque la 5P del ste è un po più stretta della 5P del sgi. Vediamo prima cosa accade tra la 1P e la 5P del ste. Dalla
288
10.5 Errori sulle terne uniDSBS
Figura 10.14: 3M in ste (in alto) e in sgi (in basso) nella triade maggiore
precedente trattazione sui bcs tra due suoni, sappiamo che dovremo aspettarci un battimento, per la frequenza esempio di 440 Hz, pari a β = |M ε| = |2ε| ≈ 1.4898 Hz Analizzando l’onda somma su un secondo (figura 10.15), troviamo chiaramente evidente il bcs di circa 1.5 Hz. Se ora cambiamo anche la 5P nella triade maggiore, dovremmo
289
10 Accordi stonati
Figura 10.15: Battimento per quinta in ste
riuscire a riconoscere una modulazione simile, sovraimposta alla apotonia vista poco fa.
Figura 10.16: Triade maggiore in ste
L’immagine di una triade maggiore in temperamento equabile (figura 10.16) rivela i battimenti sulla unidsbs ma notiamo che sono a loro volta modulati in ampiezza con frequenza pari a circa 1.5 Hz = |2ε| in quanto errore tra 1P e 5P. 290
10.5 Errori sulle terne uniDSBS Se contassimo i picchi del battimento, vedremmo che ora sono più di 8.7: sembra infatti che ce ne siano circa 9.5. Di fatto accorciando la 5P, abbiamo ulteriormente aumentato il divario tra la usb e la lsb, ovvero abbiamo aumentato la banda nascosta hb e di conseguenza anche la frequenza del battimento. Infatti, se calcoliamo la hb attuale, troveremo � � 7 4 HB = νU + νL − 2νC = 2 /12 + 1 − 2 · 2 /12 νL ≈ ≈ −0.0215 · 440 = −9.4754
che corrispondono proprio ai circa 9.5 Hz di battimento da consonanza stonata che abbiamo trovato osservando empiricamente la forma dell’onda. Ci siamo soffermati così tanto sulla triade maggiore perché è uno dei “mattoni” fondamentali del sistema musicale europeo. Abbiamo notato infatti che gode della particolare proprietà delle sintonie unidsbs. Notiamo però che il fatto di aver posto USB = LSB non implica che UR = LR: il rapporto νC /νL è diverso dal rapporto νU /νC . In musica questo è ben noto, infatti sappiamo che il rapporto tra la 3M e la 5P è pari a 32 ÷ 54 = 65 una terza minore. Questo è da tener presente soprattuto per il fatto che, sebbene la frequenza ζ del bcs dipenda solo dall’errore introdotto (come abbiamo visto), è invece diverso l’effetto dell’errore sui rapporti tra i suoni; applicare per esempio un errore di +1 Hz alla nota centrale νC della terna 100�150�200 oppure applicare lo stesso errore alla terna 800�1000�1200, modifica in modo diverso i rapporti ul e ur ma produce il medesimo bcs. D’altro canto, in ambito musicale, si tende molto spesso a pensare alle note solo in termini di rapporti, perché questa è la consuetudine, dimenticandosi pertanto che in realtà sono
291
10 Accordi stonati frequenze con un valore ben definito; quindi si tende a credere che, dato che l’applicazione di un errore di +1 Hz su 1000 nella terna 800�1000�1200 varia di poco il rapporto tra νC e νL rispetto allo stesso errore applicato su 150 nella terna 100�150�200, l’effetto globale di questo errore diventi sempre più trascurabile man mano che le frequenze siano più elevate o che i rapporti siano più lontani. Ma questo, come abbiamo visto, non è assolutamente vero. L’effetto apotonico di un errore quantificabile in Hz applicato ad una terna di suoni è indipendente dalla frequenza e dal rapporto reciproco tra i suoni stessi. Diverso è se introduciamo invece un errore esplicitamente dipendente dalla frequenza del suono fondamentale νL , come nel caso che abbiamo trattato della 3M del STE. È chiaro che in questo caso scegliamo volutamente un errore dipendente dalle frequenze, introducendo un errore sul rapporto tra le frequenze, che sarà poi da quantificare, scelta una frequenza campione. Di fatto la scala logaritmica è legata solamente alla nostra percezione dell’altezza dei suoni che si basa sui rapporti ma, come abbiamo visto nel Capitolo 9, le proprietà geometriche dei suoni e dunque anche i bcs sono in scala lineare e sono pertanto basati sulla differenza tra le frequenze. Dunque, la definizione in cents dell’errore d’intonazione su due frequenze di pertinenza musicale si riferisce alla percezione del pitch ma non agli effetti fisici e matematici sull’onda ψsum . L’introduzione di un errore di ±E Hz sulla hb di una sintonia unidsbs produrrà pertanto un battimento ζ = |±E| Hz a prescindere dalle frequenze conivolte, mentre avrà differente effetto su lr e ur dipendentemente dalla frequenza scelta.
292
10.5 Errori sulle terne uniDSBS Infatti possiamo dire che HB = ±E = ∓2ε Quindi ±ε = ∓
E 2
Pertanto LR = UR =
N νL ∓ M E2 N νL ± M ε νC = = νL M νL M νL
JM νL νU JM νL = = νC N KνL ± M Kε N KνL ∓ M K E2
Dunque, all’aumentare di νL diminuisce sempre più l’effetto di ε (e di E) sulla percezione dell’altezza del suono (pitch) ma, se il suono in questione è prodotto in intervallo armonico o in un accordo, l’errore d’intonazione diventa evidente a causa dei bcs che sono indipendenti dalla frequenza. Applichiamo quindi un errore ε = 1 Hz su νC nelle due terne 100�150�200 e 800�1000�1200 (figura 10.17). Figura 10.21 νL = 100 Hz 5 · 100 + 4 = 1.26 4 · 100 3 · 4 · 100 1200 UR = = ≈ 1.1905 5 · 2 · 100 + 4 · 2 1008 LR =
Dunque
∆LR =
5 − LR = −0.01 4 293
10 Accordi stonati ∆UR =
6 − UR ≈ 0.0095 5
nel caso di νL = 100 Hz lo scarto ∆LR tra il rapporto inferiore di giusta intonazione 54 ed lr è di 0.01, mentre lo scarto ∆UR tra 65 di giusta intonazione e ur è invece di circa 0.0095.
Figura 10.17: Effetto di un errore ε = 1 Hz sulle terne 100�150�200 (in alto) e 800�1000�1200 (in basso)
νL = 800 Hz
294
10.6 Geometria e terne uniDSBS 5 · 800 + 4 = 1.25125 4 · 800 9600 3 · 4 · 800 = ≈ 1.1988 UR = 5 · 2 · 800 + 4 · 2 8008 Dunque LR =
5 − LR = −0.00125 4 6 ∆UR = − UR ≈ 0.0012 5 Nel caso quindi di νL = 800 Hz lo scarto ∆LR tra lr e il rapporto di giusta intonazione è di −0.00125 e ∆UR relativo ad ur è pari a 0.0012. Dunque il pitch errato delle due frequenze νC verrà percepito meno nel secondo caso (in un intervallo melodico) ma verranno in entrambi i casi uditi i bcs pari a ζ = |−2ε| = 2 Hz nel caso le tre frequenze vengano suonate contemporaneamente (in un intervallo armonico). ∆LR =
10.6 Geometria e terne uniDSBS Laddove N sia uguale ad M + 1, ovvero dove νC /νL sia una consonanza perfetta o imperfetta o, in altri termini, lr sia una frazione dell’inviluppo E1 della curva delle frazioni vista nel Capitolo 9, sapendo che J 2N − M = K M allora, sostiuendo N in funzione di M J 2M + 2 − M M +2 = = K M M
295
10 Accordi stonati e riducendo ai minimi termini J M + 2 M CD {M + 2; M } = · K M M CD {M + 2; M }
dove M CD {n; m} è il Massimo Comun Divisore dei numeri n ed m. Pertanto, data una qualunque frazione MM+1 esprimente il rapporto tra νC e νL (il rapporto inferiore lr) il rapporto di J ) è dato dalla frazione MM+2 ridotta ai banda br (quindi K minimi termini, la quale esprime anche il rapporto tra νU e νL . Dal punto di vista geometrico (vedi Capitolo 9), si tratta di quelle terne che formano triangoli isosceli i cui lati sono le corde lsb e usb (che infatti sono uguali) con base bw. I due lati uguali del triangolo isoscele sono i primi due lati (a partire da 1P) di tutti i poligoni regolari inscritti nella circonferenza e corrispondono alle bande laterali. La larghezza di banda è la base del triangolo. Di fatto, una frazione MM+1 è geometricamente il primo vertice di un poligono regolare avente M lati, mentre MM+2 è il secondo vertice dello stesso poligono, dunque le due corde sottese sono uguali (figura 10.18). Nelle terne sgi con errore connaturato, il triangolo formato dalla terna è simile ad un triangolo isoscele ma contiene un “errore”. Per esempio la terna 1P�3m�4�, vista precedentemente, è geometricamente simile alla terna 1P�3m� 75 che è un triangolo isoscele (figura 10.19). L’errore è pertanto, in questo caso, su usb che corrisponde alla corda 3m 4� e si ripercuote anche su bw cioè sulla base 1P 4�. Nella triade maggiore di temperamento equabile, l’errore più evidente è su entrambe le corde corrispondenti ad usb ed lsb, essendo maggiore sulla consonanza di terza maggiore
296
10.6 Geometria e terne uniDSBS
Figura 10.18: Triangoli isosceli e terne unidsbs
sebbene, come abbiamo notato anche in altre occasioni, vi è un errore anche su νU dovuto alla non perfetta consonanza di quinta giusta, che si ripercuote anche su bw, cioè sulla base del triangolo (figura 10.20). Forniamo qui sotto una tabella completa con tutti gli errori sulle unidsbs degli intervalli di giusta intonazione su due ottave e sulla frequenza campione νL = 503 Hz. L’errore è espresso in Hz: quando l’errore è pari a zero la terna è una unidsbs, quando è vicino ma diverso da zero l’errore produrrà un bcs (figure 10.21 e 10.22). Vi sono numerose altre sintonie possibili fra tre frequenze ed altrettante complesse interazioni tra gli errori d’intonazione su ciascuna sintonia ma, data la complessità e la notevole estensione di una analisi dettagliata dell’argomento, rimandiamo la loro trattazione ad ulteriori studi e pubblicazioni.
297
10 Accordi stonati
Figura 10.19: Errore della terna 1P�3m�4� rispetto alla terna 1P�3m� 75
Figura 10.20: Errore della triade maggiore in ste rispetto al sgi
298
10.6 Geometria e terne uniDSBS
Figura 10.21: Errori sulle unidsbs entro due ottave (1)
299
10 Accordi stonati
Figura 10.22: Errore sulle unidsbs entro due ottave (2)
300
11 Una legge per i BCS ue suoni puri in intervallo armonico, ovvero presentate D contemporanemente, il cui rapporto ν /ν sia di poco differente ad un rapporto semplice N/M a meno di un er2
1
rore ε, danno luogo a battimenti denominati battimenti da consonanze stonate (bcs) la cui frequenza è noto essere pari ad |M ε|. È possibile derivare una legge che descriva in buona approssimazione i bcs per due frequenze e quindi il profilo superiore e inferiore dell’inviluppo dell’onda somma. Quest’equazione dipende da N , M , ε, dalle ampiezze delle componenti e dalla loro fase, ed è indipendente dalle due frequenze. È noto che i battimenti primari, i quali si verificano per due onde la cui differenza sia pari ad ε ≤ 20 Hz, sono descritti dalla formula dell’inviluppo primario dell’onda somma se l’ampiezza delle due componenti è la medesima. Chiameremo consonanze proprie due frequenze in rapporto pari a rapporti denominati consonanze perfette e imperfette in ambito musicale: unisono perfetto (1P, ratio 11 ), ottava perfetta (2P, ratio 21 ), quinta giusta (5P, ratio 32 ), quarta giusta (4P, ratio 43 ), terza maggiore (3M, ratio 54 ) e terza minore (3m, ratio 65 ). Considereremo consonanze proprie anche gli armonici, e dunque rapporti di ratio pari ad N 1 (M =1). Chiameremo consonanze improprie, due frequenze in rapporto tra loro secondo proporzioni non definite come consonanze perfette o imperfette in ambito musicale, fino al limite massimo di N = 9 ed M = 8, dato che oltre
301
11 Una legge per i BCS questo limite il rapporto è troppo complesso per essere definito consonanza sensoriale e sia la frequenza che l’ampiezza dei bcs supera la capacità di discriminazione. Useremo pertanto due frequenze ν2 e ν1 , tali per cui ν2 ≥ ν1 e in relazione tra loro secondo l’uguaglianza ν2 = con
N ν1 + ε N
N, M ∈ N
ε∈R
dove dunque N ed M sono numeri interi positivi compresi tra 1 e 10 e in cui N ≥ M e tali per cui la frazione N/M sia ridotta ai minimi termini; ε è un numero reale tale per cui |ε| ≤ 20 Hz. Porremo inizialmente che la fase delle due componenti sia la medesima e che le ampiezze delle due onde siano uguali e pari a 1. Pertanto l’onda somma sarà ψsum = A1 sin (2πν1 t + φ1 ) + A2 sin (2πν2 t + φ2 ) quindi, sostituendo ν2 in funzione di ν1 � � � � N ν1 + ε t + φ2 ψsum = A1 sin (2πν1 t + φ1 )+A2 sin 2π M dove, almeno inizialmente A1 = A2 = 1 φ 1 = φ2 = φν quindi � � � � N ν1 + ε t + φν ψsum = sin (2πν1 t + φν ) + sin 2π M 302
Ci riferiremo dunque inizialmente alle fasi delle onde componente di ψsum ciamandole φν . Chiameremo νβ la frequenza del bcs e ψβ l’onda che lo descrive. Volendo trattare separatamente il profilo superiore e inferiore dell’onda somma, avremo dunque due onde, ψβ+ che descrive la semionda positiva e ψβ– che descrive la semionda negativa e le due onde assumeranno la seguente forma: ψβ+ = Aβ |cos (πνβ t + φβ+ )| + Amin ψβ− = −Aβ |cos (πνβ t + φβ− )| − Amin Dove Aβ è l’ampiezza del bcs, νβ è la frequenza, φβ+ e φβ– sono le fasi del bcs e Amin è un parametro che determina la “posizione” delle onde del bcs sull’asse y e che dipende dalle ampiezze massime locali dell’onda somma nell’intorno del punto in cui il bcs è al minimo. Raccoglieremo i dati utilizzando il programma Grapher di MacOsX. Analizzeremo le onde usando un errore ε tale per cui il bcs sia pari ad n Hz prestabiliti. È noto in letteratura che i bcs sono indipendenti dalle frequenze coinvolte e sono pari ad |M ε|. Da questo possiamo ricavare l’errore ε nei casi che tratteremo. νβ = |M ε| Dunque |ε| =
νβ M
Essendo indipendente dal segno di ε possiamo porre ε=
νβ M
303
11 Una legge per i BCS
11.1 Fasi Ponendo la fase delle onde componente pari a φν =
π 2
le due onde partono in fase a +1 perché per t = 0 l’onda somma si riduce alla somma dei seni di due angoli π2 , i quali sono pari 1; per t = 0
ψsum = sin
π π + sin = 1 + 1 = 2 2 2
dunque l’onda somma parte da +2, ovvero dal suo picco massimo. In questo caso quindi φβ+ = 0 (perché ψβ sono coseni); questo significa che anche l’onda che descrive il profilo superiore ψβ+ parte dal suo picco massimo Aβ + Amin . per t = 0
ψβ+ = Aβ cos 0 + Amin = Aβ + Amin
Per ε �= 0 il successivo picco massimo di ψβ+ verrà raggiunto in un periodo di tempo uguale al periodo del battimento bcs, che corrisponde ad 1/M ε secondi. Essendo la funzione seno periodica per 2π, sappiamo che per φν = n2π + π2 , le onde componente torneranno alla situazione iniziale. Variando la fase φν le due onde non partono più da +1, e quindi l’onda somma non parte dal picco massimo di +2, ma può raggiungere il primo picco massimo in fase o in quasi fase entro un tempo variabile e un numero di volte non costante tra π2 e 52 π (un angolo giro, da π2 a 2π + π2 ).
304
11.1 Fasi È possibile dimostrare empiricamente che φβ+ e φβ− dipendono da N ed M e sono indipendenti dalle frequenze e da ε. Per dimostrarlo utilizzeremo il programma Grapher di MacOsX. Sappiamo dal Capitolo 9 che la suddivisione in 12 parti uguali di eventi periodici è vantaggiosa. Suddivideremo dunque la circonferenza 2π in 12 settori a partire da π2 fino a 52 π. Assegneremo ciascuno dei tredici valori a φν e osserveremo la fase dei bcs per tre frequenze differenti e per due errori differenti. Le tre frequenze scelte saranno νa = 101 Hz ν b = 881 Hz ν c = 4999 Hz Abbiamo scelto queste tre frequenze essendo numeri primi e appartenendo ad ottave non contigue. I bcs che osserveremo saranno di 1 e 2 Hz. Questi valori sono scelti a causa delle limitazioni grafiche del programma utilizzato. Valori più elevati avrebbero reso illeggibili i grafici. Dunque l’errore ε sarà: νβ 1 ε= = M M ed νβ 2 ε= = M M Valuteremo le frazioni: 21 , 31 , 41 , 51 , 61 , 32 , 52 , 72 , 43 , 53 , 73 , 83 , e 76 . In figura 11.1 sono visualizzabili le impostazioni del programma Grapher con cui abbiamo generato i grafici nelle figure da 11.2 a 11.7. 5 7 6 7 8 9 4, 4, 5, 5, 5, 5
305
11 Una legge per i BCS
Figura 11.1: Impostazione per figure da 11.2 a 11.7
Di volta in volta abbiamo impostato i parametri N , M e νβ secondo le specifiche menzionate. Nonostante le limitazioni grafiche del programma, possiamo notare che il numero di volte in cui ψβ+ è al suo picco massimo, tra π2 e 52 π, è indipendente dalle frequenze e dall’errore ma è direttamente proporzionale ad N ed M . Per comprendere come N ed M influiscano sulla fase del bcs, procediamo con una ulteriore osservazione. Poniamo ora che la fase delle due onde componente non sia uguale. Avremo pertanto φ1 �= φ2 � � � � N ν1 + ε t + φ2 ψsum = sin (2πν1 t + φ1 ) + sin 2π M Suddividiamo le osservazioni di due casi: � � 1. φ1 = π2 φ2 = π2 . . . 52 π . Facciamo variare φ2 da 5 π 2 π mantenendo constante φ1 a 2 ;
306
π 2
a
11.1 Fasi
Figura 11.2: φ1 = φ2
307
11 Una legge per i BCS
Figura 11.3: φ1 = φ2
308
11.1 Fasi
Figura 11.4: φ1 = φ2
309
11 Una legge per i BCS
Figura 11.5: φ1 = φ2
310
11.1 Fasi
Figura 11.6: φ1 = φ2
311
11 Una legge per i BCS
Figura 11.7: φ1 = φ2
312
11.1 Fasi � � φ2 = π2 . Facciamo variare φ1 da 2. φ1 = π2 . . . 52 π 5 a 2 π mantenendo constante φ2 a π2
π 2
Sarà sufficiente scegliere tre frazioni differenti per ciascuno dei due casi e osservare quante volte da π2 a 52 π il bcs (e dunque l’onda somma) raggiunge il picco massimo. Scegliamo i rapporti 1.
4 5 3, 2
e
5 1
per il primo caso
2.
4 5 3, 2
e
3 2
per il secondo caso
Suddivideremo dunque l’intervallo d’osservazione in 60 parti π π uguali (3 · 4 · 5) quindi in settori da 2π 60 = 30 , a partire da 2 5 5 π fino a 2 π (non ci occuperemo di 2 π essendo pari a 2 + 2π). In figura 11.8 le impostazioni del programma Grapher con cui abbiamo generato i grafici delle figure 11.9 e 11.10.
Figura 11.8: Impostazioni per le figure 11.9 e 11.10
Dunque notiamo che 1. Al variare di φ2 il numero di volte in cui il bcs raggiunge il picco massimo (asterischi in figura 11.9) da π2 a 52 π è pari ad M
313
11 Una legge per i BCS
Figura 11.9: φ1 �= φ2 caso 1 (φ2 variabile)
314
11.1 Fasi
Figura 11.10: φ1 �= φ2 caso 2 (φ1 variabile)
315
11 Una legge per i BCS 2. Al variare di φ1 il numero di volte in cui il bcs raggiunge il picco massimo (asterischi in figura 11.10) da π2 a 52 π è pari ad N A questo punto è semplice ricavare una legge che definisca la fase di φβ+ e ψβ– in funzione di φ1 e φ2 . Iniziamo da φβ+ : • sottraiamo π2 a φ1 e φ2 per conoscere la differenza tra le due fasi e la fase π2 , in cui sicuramente il bcs e l’onda somma sono al picco massimo; • moltiplichiamo il risultato rispettivamente per N ed M e dividiamo per 2 (essendo le ψβ periodiche per π dato che sono rettificate a doppia semionda a causa del valore assoluto); • la differenza tra i due termini, darà il valore di φβ+ . M� π� N � π� φ2 − − φ1 − φβ+ = 2 2 2 2
Per trovare φβ– sarà sufficiente sottrarre 52 π (o, più semplicemente, aggiungere π2 ) a φ1 e φ2 essendo questo il valore per cui il bcs è al minimo, dato che l’onda somma per questa fase è al minimo. M� π� N � π� φ2 + − φ1 + φβ− = 2 2 2 2
Possiamo anche notare che quando (N − M ) è dispari il profilo superiore e il profilo inferiore dell’onda somma sono sfasati di π2 , cioè al picco positivo del bcs nella semionda positiva corrisponde una cuspide nella semionda negativa e viceversa. Se invece (N − M ) è pari, i bcs sono in fase nelle due semionde, positiva e negativa. Infatti, calcoliamo la
316
11.1 Fasi differenza tra φβ+ e φβ– φβ+ − φβ− =
M� π� N � π� φ2 − − φ1 − − 2 2 2 2
� Nπ Mπ π� N � π� M� φ2 + − φ1 + = − − 2 2 2 2 2 2 �
Dunque
φβ+ − φβ− = (N − M )
π 2
Un numero pari può essere difinito come 2a dove a è un intero postivo, mentre un numero dispari può essere definito come 2a + 1. Dunque se (N − M ) è pari (N − M ) = 2a Quindi φβ+ − φβ− = 2a
π = aπ ≡ π 2
Dunque le due onde sono in fase essendo periodiche per π. Mentre se (N − M ) è dispari (N − M ) = 2a + 1 Dunque φβ+ − φβ− = 2a
π π π π + = aπ + ≡ 2 2 2 2
Quindi le due onde sono sfasate di periodo (π).
π 2
corrispondente a metà
317
11 Una legge per i BCS
11.2 Ampiezze 11.2.1 Unisono perfetto Il battimento primario, quale errore d’intonazione sull’unisono perfetto necessita di una trattazione a parte. Il battimento da errore sull’unisono perfetto (ratio 11 ) corrisponde al battimento primario, dunque νβ = |M ε| con M = 1 quindi νβ = |ε|. Pertanto la frequenza del bcs è pari al modulo dell’errore. Se le ampiezze delle onde componenti sono A1 = A2 = A l’ampiezza massima dell’onda somma è A1 +A2 = 2A quindi Aβ = 2A; l’ampiezza a metà periodo del bcs (quando il bcs è al minimo) è pari a 0, quindi Amin = 0. In figura 11.11 sono mostrate quattro onde sovrapposte, per un errore ε di 1 Hz su un unisono in cui ν1 = 100 Hz, e le relative onde che descrivono il battimento primario. In questo caso essendo N ed M uguali a 1, le fasi φβ+ e φβ− si riducono a φ2 − φ 1 φβ+ = φβ− = 2 Pertanto le onde che descrivono il battimento per A1 = A2 = A sono � �� � � φ2 − φ1 �� � ψβ+ = 2A �cos π |ε| t + � 2 � �� � � φ2 − φ1 �� ψβ− = −2A ��cos π |ε| t + � 2 Per A1 �= A2 l’onda del battimento non raggiunge mai lo zero ma a metà periodo del battimento la sua ampiezza è pari ad |A1 –A2 |. Inoltre i profili superiore e inferiore dell’onda somma non hanno la forma di una sinusoide rettificata ma sono più simili ad una sinusoide a onda intera (figura 11.12).
318
11.2 Ampiezze
Figura 11.11: Battimento primario per A1 = A2 = A
Pertanto vi saranno due condizioni per la descrizione dei due profili: � A2 cos (2πεt + (φ2 − φ1 )) + A1 A1 > A2 ψβ+ = A1 cos (2πεt + (φ2 − φ1 )) + A2 A1 < A2 ψβ− =
�
−A2 cos (2πεt + (φ2 − φ1 )) − A1 −A1 cos (2πεt + (φ2 − φ1 )) − A2
A1 > A2 A1 < A2
In questo modo, l’onda superiore è pari ad A1 + A2 al picco massimo del battimento e ad |A1 –A2 | al picco minimo del battimento. La semionda inferiore invece sarà a – (A1 + A2 ) al picco massimo negativo e a − |A1 − A2 | al picco minimo del battimento. Le due onde descrivono solo in prima approssimazione il profilo dell’onda somma, perché nell’intorno dei picchi massimi la curva dell’inviluppo è più eccentrica di una sinusoide semplice come si può notare da 11.13.
319
11 Una legge per i BCS
Figura 11.12: Battimento primario per A1 �= A2
Nonostante le ψβ non descrivano esattamente l’inviluppo dell’onda somma, ovvero non siano tangenti a tutti i massimi locali dell’onda, ne sono comunque una descrizione in buona approssimazione.
11.2.2 Frazioni Nell’ottava perfetta e in tutti gli armonici il denomintore M = 1, infatti il rapporto tra ν1 e ν2 è pari a N1 . Pertanto l’introduzione dell’errore ε porterà anche in questo caso ad un battimento di frequenza νβ = |M ε| = |ε|. L’ampiezza massima, quando A1 = A2 = 1, sarà sempre pari a ±2. L’ampiezza minima del bcs invece dipende in modo non lineare da N ed M ed è indipendente da ε e dalle frequenze, come è possibile evincere dalle figure da 11.2 a 11.7. In figura 11.14 sono mostrate le impostazioni del programma Grapher con cui abbiamo generato le figure 11.15 e 11.16.
320
11.2 Ampiezze
Figura 11.13: Approssimazione delle ψβ per il battimento sull’unisono
321
11 Una legge per i BCS L’ampiezza minima dei bcs è valutata per cinque frequenze diverse (300, 600, 1200, 2400 e 4800 Hz) e per due valori di 1 2 ε: M e M corrispondenti a bcs di 1 e 2 Hz. Sono stati di volta in volta impostati i parametri N ed M ed un valore 1 . Le empirico corrispondente ad Amin per ν = 300 ed ε = M frazioni utilizzate sono state scelte tali per cui N > M ed N + M ≤ 11 e ridotte ai minimi termini.
11.2.3 Ampiezza minima dei BCS È possibile dunque dimostrare empiricamente che l’ampiezza minima dei bcs (Amin ) è indipendente dalle frequenze coinvolte e dall’errore ε ma è dipendente da N ed M (figure 11.15 e 11.16). 1 avremo un bcs di frequenza Sappiamo che per ε = M νβ = 1 Hz. Per φ1 = φ2 = π2 ed A1 = A2 = 1, le due onde componente partono in fase a +1 in t = 0, quindi l’ampiezza dell’onda somma e del bcs sono massimi in t = 0. Ai contorni di metà periodo del periodo del battimento, quindi in t=
1 Tβ = = 0.5 sec 2 2νβ
avremo la minima ampiezza massima dell’onda somma (un massimo locale minore del massimo assoluto) e dunque del bcs. L’ampiezza dell’onda somma nell’intorno di t = 0.5 è pari all’ampiezza dell’onda somma di due frequenze senza π errore, con ψ2 avente fase φ2 = M + π2 infatti: � � � � � N π� π ψsum = sin 2πν1 t + + sin 2π ν1 + ε t + 2 M 2 322
11.2 Ampiezze
Figura 11.14: Impostazioni per figure 11.15 e 11.16
323
11 Una legge per i BCS
Figura 11.15: Ampiezza minima dei bcs (1)
324
11.2 Ampiezze
Figura 11.16: Ampiezza minima dei bcs (2)
325
11 Una legge per i BCS equivale a ψsum
� � N π� π + sin 2π ν1 t + 2πεt + = sin 2πν1 t + 2 M 2 �
interpretabile come modulazione lineare di fase di ψ2 se1 condo il termine 2πεt. Dunque per ε = M (bcs di frequenza νβ = 1 Hz): � � � N π� 2πt π + sin 2π ν1 t + + ψsum = sin 2πν1 t + 2 M M 2 sostituendo t = 0.5 nella fase di ψ2 avremo pertanto: � � � N π π� π ψsummin = sin 2πν1 t + + sin 2π ν1 t + + 2 M M 2
Il massimo assoluto di questa funzione è pari all’ampiezza massima dell’onda somma nel punto di cuspide di ψβ+ e dunque al massimo locale di ψsum all’intorno del punto di ampiezza minima del bcs. La dimostrazione empirica di questa affermazione si può trovare in figura 11.18 (impostazioni del programma Grapher in figura 11.17). Pertanto per misurare l’ampiezza massima dell’onda somma nei punti di cuspide del bcs, potremo verificare il valore di ψsummin per i massimi assoluti. Essendo l’ampiezza indipendente dalla frequenza, possiamo porre ν1 = 1 Hz (superando 1 . così le limitazioni di calcolo di molti calcolatori) ed ε = M Dunque, ponendo A1 �= A2 , ψsummin si riduce a � � � π π π� N ψsummin = A1 sin 2πt + + A2 sin 2π t + + 2 M M 2 Basterà cercare il massimo assoluto di ψsummin per avere il valore di Amin .
326
11.2 Ampiezze
Figura 11.17: Impostazioni per figura 11.18
327
11 Una legge per i BCS
Figura 11.18: Dimostrazione della validità di ψsummin
328
11.2 Ampiezze Pertanto le equazioni delle due onde che descrivono il profilo superiore e inferiore dell’onda somma � � � � N ψsum = A1 sin (2πν1 t + φ1 )+A2 sin 2π ν1 + ε t + φ2 M indicando come {f (x)}max
il massimo assoluto di una funzione f (x), sono: ψβ+ = Aβ |cos (πνβ t + φβ+ )| + Amin Dove:
ψβ− = −Aβ |cos (πνβ t + φβ− )| − Amin Amin = {ψsummin }max Amax = A1 + A2 Aβ = Amax − Amin
e
M� π� N � π� φ2 − − φ1 − 2 2 2 2 M� π� N � π� φ2 + − φ1 + φβ− = 2 2 2 2 Proviamo quindi, come esempio, a determinare i profili superiore e inferiore per i seguenti valori: φβ+ =
ν1 = 447 Hz N =4 M =3 ε = 2.37 Hz
329
11 Una legge per i BCS
Figura 11.19: Onda somma dell’esempio di calcolo
φ1 =
11 π 7
φ2 =
4 π 9
A1 = 1.723 A2 = 2.91 Anzitutto osserviamo l’onda somma in figura 11.19. Calcoliamo la frequenza del battimento: νβ= |M ε| = |3 · 2.37| = 7.11 Hz Ora calcoliamo φβ+ e φβ– : M� π� N � π� φ2 − − φ1 − = 2 2 2 2 � � � � 3 4 π 4 11 π 187 = π− − π− =− π 2 9 2 2 7 2 84 M� π� N � π� φβ− = φ2 + − φ1 + = 2 2 2 2 φβ+ =
330
11.2 Ampiezze 3 = 2
�
π 4 π+ 9 2
�
4 − 2
�
π 11 π+ 7 2
Calcoliamo l’ampiezza massima:
�
=−
229 π 84
Amax = A1 + A2 = 1.723 + 2.91 = 4.633 Troviamo il massimo assoluto della funzione ψsummin per avere il valore di Amin (figura 11.20) � � � π π π� N ψsummin = A1 sin 2πt + + A2 sin 2π t + + 2 M M 2 Dunque
{ψsummin }max = Amin ≈ 4.2436 Pertanto Aβ = Amax − Amin ≈ 4.633 − 2.2436 = 0.3894 Quindi (figura 11.21): � �� � � 187 �� � ψβ+ ≈ 0.3894 �cos π · 7.11 · t − π � + 4.2436 84 � �� � � 229 �� � ψβ− ≈ −0.3894 �cos π · 7.11 · t − π � − 4.2436 84
Anche le ψβ per frazioni diverse da 11 (unisono) sono una descrizione in buona approssimazione come è possibile verificare dall’esempio in figura 11.22. Le frecce indicano i punti di errore delle ψβ . Nonostante l’errore, descrivono efficacemente i profili superiore e inferiore dell’onda somma.
331
11 Una legge per i BCS
Figura 11.20: Misurazione di {ψsummin }max
332
11.2 Ampiezze
Figura 11.21: Calcolo delle ψβ
Notiamo infine che questo metodo di calcolo restituisce il valore esatto di Aβ ma necessita la discussione analitica della funzione ψsummin . In figura 11.23 sono mostrate alcune misurazioni di Amin ordinate secondo il valore Aβ che è la differenza tra Amax e Amin . È possibile notare una certa corrispondenza, anche se non lineare, tra i valori di N , M , A1 , A2 e Aβ . Speriamo che ulteriori studi possano portare alla formulazione di una relazione semplice tra Amin e le altre variabili coinvolte.
333
11 Una legge per i BCS
Figura 11.22: Errori delle ψβ
334