126 53 8MB
Portuguese Pages 671 Year 2009
Prefácio R ° ELETROMAGNETISMO com MATHEMATICA é fruto de 25 anos de ensino das disciplinas de Eletromagnetismo e de Métodos Elétricos e Eletromagnéticos no Curso de Pós-graduação em Geofísica do Centro de Geociências da Universidade Federal do Pará. Em virtude de Geofísica ser multidisciplinar, o universo de alunos no nosso curso de pós-graduação é muito amplo, vindo de diversas áreas do conhecimento: geologia, matemática, física, engenharia elétrica, engenharia civil e áreas afins. Com uma platéia tão diversificada quanto esta, é sempre um desafio iniciar, cada ano, o curso com novos alunos. Os graduados em geologia chegam com conhecimentos modestos de matemática e computação, e praticamente nenhum treinamento em eletromagnetismo. Os graduados em matemática, por sua vez, conhecem matemática formal mas, pouca experiência em computação cientifica e em eletromagnetismo. Os graduados em física e engenharia elétrica trazem consigo alguns conhecimentos de eletromagnetismo, mas se ressentem da falta de treinamento nos aspectos computacionais desta matéria, tão necessários às disciplinas avançadas dos métodos geofísicos elétricos e eletromagnéticos. O objetivo deste livro é, na medida do possível, suprir algumas dessas deficiências. Trata-se, portanto, de um livro básico orientado tanto para a graduação em geofísica, quanto para os alunos iniciantes à pós-graduação nesta área. Alunos de graduação em física, matemática aplicada e engenharia elétrica podem, igualmente, usufruir o livro como complemento às disciplinas de computação científica. Sem os avanços tecnológicos em computação (hardware e software) este livro não teria sido concebido. Diferente dos livros tradicionais de eletromagnetismo, a ênfase é nos aspectos computacionais das equações de Maxwell orientados para a solução de problemas práticos. É ai que o computador entra em sena e o principal ator é o sistema Mathematica de computação simbólica, numérica e gráfica. O Mathematica é um sistema revolucionário que facilita enormemente a aprendizagem e uso da matemática tradicional. Com
xi
xii
PREFÁCIO
ele, o trabalho, cansativo e desestimulante de efetuar cálculos e mais cálculos, assessorados por calculadoras de mão, torna-se coisa do passado, exatamente como aconteceu, no início da década de setenta, quando as primeiras calculadoras substituíram as réguas de cálculos. Com um detalhe, as calculadoras programáveis de hoje são infinitamente superiores as do passado. O livro acompanha um CD-Rom que contém os Notebooks de todos os programas desenvolvidos no texto. Para minimizar repetições desnecessárias, muito deles estão restritos ao CD-Rom, indicados no texto pelo ícone (*--CD - ROM
. O livro consta de dez capítulos. O primeiro serve de vitrine aos demais. Nele, as equações de Maxwell, nas formas integral e diferencial, são apresentadas axiomaticamente em cinco versões diferentes, da mais geral à mais especializada, com vista à Geofísica. A forma integral reflete as idéias originais de linha de força e de fluxo de Faraday, que tanto influenciaram Maxwell. Por isso, acredito ser esta a melhor maneira de iniciar o estudo de eletromagnetismo. O segundo capítulo traz uma síntese das ferramentas matemáticas necessária à decodificação das equações de Maxwell. Inicia-se com as integrais de linha e de superfície em comum acordo com as equações de Maxwell na forma integral. A partir das integrais de linha e de superfície se chega aos operadores: rotacional e divergência, fundamentais na representação diferencial das equações de Maxwell. A transformação de uma forma para a outra se faz por intermédio dos Teoremas de Stokes e de Gauss. Por fim é apresentada uma síntese sobre séries e transformadas de Fourier, ferramentas indispensáveis para simplificar os problemas de eletromagnetismo O terceiro capítulo é de cunho histórico. De posse das ferramentas matemáticas, cada uma das equações de Maxwell é analisada cuidadosamente do ponto de vista histórico, físico e matemático. No final do terceiro capítulo espera-se que o leito se sinta à vontade para usar inteligentemente as equações de Maxwell e solucionar, de modo eficiente, problemas de eletromagnetismo. A maneira como os três primeiros capítulos devem ser explorados depende do gosto de cada um. Talvez, alguns prefiram iniciar com os capítulos dois e três e voltar ocasionalmente ao primeiro capítulo. Entretanto, acredito que uma visão panorâmica das equações de Maxwell serve de motivação para a preparação da base matemática, objeto do segundo capítulo. De qualquer modo, os três primeiros capítulos devem ser lidos e relidos mais de uma vez para consolidar os princípios básicos do eletromagnetismo. Eles não são difíceis, mas são sutis. Por isso, no começo é preciso perseverança, persistência e muito trabalho. Vencida a primeira etapa, os Este programa se encontra no CD-Rom ---*)
xiii demais capítulos seguirão tranqüilamente sem nenhum problema. O quarto capítulo se destina às primeiras aplicações em eletrostática. Neste caso as equações de Maxwell se dissolvem na equação de Laplace. Iniciando com as coordenadas cartesianas, as séries de Fourier desempenham papel fundamental na resolução dos problemas deste capítulo. A simetria cartesiana é muito rígida e muito particular. Para se explorar outras simetrias, notadamente, cilíndrica e esférica, é preciso, antes de tudo, complementar a base matemática iniciada no capítulo dois. O objetivo deste quinto capítulo é exatamente este. Oferecer uma introdução às funções especiais (Bessel, Airy, Sturve, Polinômios de Legendre, função erro, integral de Dalson, entre outras), às séries de Fourier-Bessel e Fourier-Legendre e às transformadas de Hankel e Laplace. O sexto capítulo continua com a eletrostática mas desta feita nos sistemas de coordenadas cilíndrica e esférica. Os problemas analisados no quarto e sexto capítulos são do tipo clássico e têm pouca importância na prática, embora possuam valor acadêmico, principalmente como motivação aos problemas mais interessantes que virão em seguida. Para solucionar problemas realmente práticos é necessário à intervenção do computador. É ai que a nova tecnologia computacional entra em sena. Entretanto, é preciso, primeiro, complementar, um pouco mais, o acervo de matemática iniciado nos capítulos dois e cinco. O sétimo capítulo trata exatamente deste ponto. Lá será apresentada uma introdução à matemática numérica, com ênfase nos métodos dos elementos finitos e nos métodos das equações integrais de elementos de volume e de elementos de fronteiras, essenciais para a computação científica. No oitavo capítulo, problemas de eletrostática impossíveis de serem resolvidos pelos métodos tradicionais dos capítulos quatro e seis são agora facilmente solucionados com a metodologia apresentada no sétimo capítulo. Tudo que foi feito até aqui é apenas a preparação do terreno para os dois últimos capítulos. São neles que a metodologia desenvolvida nos capítulos anteriores mostrará toda sua beleza, utilidade e eficácia. Os problemas de eletromagnetismo aplicados à geofísica se enquadram, normalmente, em duas categorias. Os mais simples, cujas fontes externas de corrente são funções senoidais e os mais complexos, em que as fontes externas são pulso de corrente. No primeiro caso se diz que o problema se encontra no domínio da freqüência e no segundo caso, no domínio do tempo. O nono capítulo trata dos problemas no domínio da freqüência. O décimo, e último, capítulo abrange os problema no domínio do tempo. Comumente um problema no domínio do tempo equivale a vários problemas no domínio da freqüência. A síntese é feita por meio das transformadas de
xiv
PREFÁCIO
Fourier e de Laplace. Os dez capítulos estão divididos em quatro categorias: a primeira é formada pelos três capítulos iniciais e formam a base conceitual do eletromagnetismo; a segunda categoria é formada pelos capítulos 2, 5 e 7 que fornecem as ferramentas matemáticas; a terceira categoria abrange os capítulos 4, 6 e 8 que nada mais são do que laboratórios de testes das ferramentas matemáticas desenvolvidas nos capítulos 2, 5 e 7 e por fim, a última categoria, constituída dos capítulos nove e dez. O capítulo dez é o fecho do livro e engloba tudo que foi visto nos demais capítulos. O diagrama a seguir mostra a interdependência dos dez capítulos. Conforme o gosto do leitor há vários caminhos para se chegar aos capítulos nove e dez. Eu proponho o caminho natural, passando por todos os capítulos, embora longo é o mais eficaz. As duplas setas sugerem que os capítulos 1, 2 e 3 devem ser relidos mais de uma vez.
Cap. 2
Cap. 1
Cap. 3
Cap. 5
Cap. 4
Cap. 7
Cap. 6
Cap. 9
Cap. 10
Cap. 8
Figura 1: Diagrama da interdependência dos capítulos. Os dez capítulos formam material suficiente para dois semestres. No primeiro semestre vêem-se os capítulos de 1 a 6. No segundo semestre, os quatro últimos capítulos. Os pré-requisitos para a leitura do livro são bastante modestos. Um curso básico de cálculo vetorial e de álgebra linear é suficiente. Conhecimento de eletromagnetismo não é necessário, entretanto, o leitor com alguns conhecimentos básicos de eletricidade e magnetismo se sentirá mais à vontade. Conhecimento prévio do sistema Mathematica também não é essencial, todavia é preciso ter familiaridade com o computador e algumas noções preliminares de programação (Matlab, Pascal, Fortran, C++ etc). Os exercícios no final de cada capítulo servem de treinamento e fixação das idéias desenvolvidas no texto e também complementam alguns tópicos omitidos no livro. Os exemplos dos programas que acompanha o CD-Rom é apenas uma pequena amostra do que pode se feito. Dê asas à sua imaginação e explore novos horizontes. Não há limite para isso!
Capítulo 1
Equações de Maxwell 1.1
Introdução
Eletromagnetismo é a parte da Física que lida com os fenômenos elétricos, magnéticos e óticos. Eletromagnetismo é o resultado, na forma de uma teoria unificada, de vários séculos de experimentos com esta classe de fenômenos. Em meados do século XIX, graças às investigações de Ampère e Faraday, já se conhecia, experimentalmente, a inter-relação entre a eletricidade e o magnetismo. Faltava, entretanto, uma teoria que unificasse todos estes conhecimentos. Na época, várias teorias foram propostas. Entre elas, destacam-se a de Weber [2] a de Maxwell [30], [48], [84]. Esta última prevaleceu, por sua elegância, simplicidade e praticabilidade. De modo que hoje, eletromagnetismo é universalmente reconhecido como sinônimo de Teoria Eletromagnética Maxwelliana. Um dos grandes triunfos da teoria de Maxwell é reconhecer que os fenômenos óticos também são de origem elétrica e magnética. Evidências científicas e aplicações tecnológicas do eletromagnetismo permeiam por toda parte. Cobrem, por exemplo, desde os delicados sinais elétricos do coração e do cérebro humano (e dos outros animais, evidentemente) às ínfimas radiações de fundo em microondas provenientes do Big Bang. Isto sem falar nas aplicações tecnológicas do dia-a-dia: rádio, TV, telefonia celular, computadores, sensoriamento remoto, radar, motores elétricos, usinas hidrelétricas, instrumentos óticos, raios X, eletrocardiografia, tomografia, prospecção geofísica de água subterrânea, exploração eletromagnética de depósitos minerais, perfis elétricos de poços de petróleo, geofones etc, etc..., para citar apenas alguns poucos exemplos. O eletromagnetismo também está por trás de muitos fenômenos naturais: a aurora boreal, o eletrojato 1
2
CAPÍTULO 1. EQUAÇÕES DE MAXWELL
equatorial, raios e trovões, as cores do arco-íris, o azul do céu, a luz das estrelas e o luar... E, por fim, sem o eletromagnetismo não haveria a Internet. É praxe nos textos elementares, o eletromagnetismo ser apresentado de acordo com o seu desenvolvimento histórico. Inicia-se com a eletrostática, seguida pela magnetostática, galvanismo, eletricidade e por fim as equações de Maxwell acompanhadas de algumas aplicações simples como em [20], [29], [39], [44], [58], [60], [61],[63],[67] e [81]. Nos textos de nível intermediário se faz o inverso, inicia-se axiomaticamente com as equações de Maxwell e a partir delas se desenvolve todo o eletromagnetismo ([4], [13], [27], [69], [75] e [78]). Nos livros mais avançados, usa-se a formulação covariante das equações de Maxwell baseada no princípio da relatividade restrita de Einstein ([6], [33], [37], [51] e [66]). Como o objetivo primordial deste livro é apresentar uma introdução aos aspectos computacionais do eletromagnetismo orientados para a Geofísica, acredito que a melhor abordagem é aquela que segue a tendência dos textos de nível intermediário. Assim, neste primeiro capítulo, as equações de Maxwell serão apresentadas axiomaticamente, constituindo o ponto de partida de tudo que será visto no restante do livro. O três próximos capítulos tratam do simbolismo matemático e da interpretação física das equações de Maxwell. Os seis capítulos seguintes preparam o embasamento para os três últimos, nos quais as equações de Maxwell serão aplicadas a vários problemas práticos de eletromagnetismo. Tudo isso com a assistência do programa aplicativo Mathematica.
1.2
Representações das Equações de Maxwell
A primeira dificuldade que os iniciantes em eletromagnetismo enfrentam é a multiplicidade de representações das equações de Maxwell. Com um pouco de exagero pode-se até afirmar que cada livro texto de eletromagnetismo traz diferente representação destas equações, nem sempre equivalentes. Algumas são mais gerais, outras mais especializadas, dependendo dos objetivos de cada autor. Os livros dedicados aos físicos apresentam formulações mais gerais com vista aos fundamentos da teoria eletromagnética e sua interrelação com outras áreas da Física teórica. Os de Engenharia Elétrica, por outro lado, trazem versões especializadas das equações de Maxwell voltadas às diversas aplicações tecnológicas nas áreas das telecomunicações, geração e distribuição de energia elétrica. Os livros de geofísica, por sua vez, adaptam as equações de Maxwell às premissas impostas pelos fenômenos naturais e pelas propriedades elétricas e magnéticas das rochas.
1.2. REPRESENTAÇÕES DAS EQUAÇÕES DE MAXWELL
3
Neste primeiro capítulo serão discutidas sucintamente cinco diferentes representações das equações de Maxwell. É instrutivo, do ponto de vista pedagógico, iniciar com a representação mais geral possível e, por meio de um processo gradativo de simplificações sucessivas, deduzir a formulação mais conveniente para as aplicações a serem tratadas no texto. Digo instrutivo pedagogicamente, porque desta maneira torna-se muito mais fácil acompanhar o significado físico de cada uma das equações de Maxwell, além de servir de motivação para o desenvolvimento das ferramentas matemáticas necessárias ao entendimento do eletromagnetismo e de suas aplicações. Os leitores que já têm algum conhecimento de eletromagnetismo não terão dificuldades em acompanhar este primeiro capítulo. Aqueles que estão iniciando podem começar pelo segundo e terceiro capítulos e voltar posteriormente ao primeiro. O processo de aprendizagem de eletromagnetismo é lento e requer paciência e persistência. Por isso, é aconselhável que os três primeiros capítulos sejam lidos e relidos duas ou três vezes, mesmo por aqueles que já têm algum conhecimento da matéria. Ler e reler significa estudar com afinco. Os fundamentos do eletromagnetismo são bastante sutis e por conseqüência devem ser estudados com muita dedicação. Isto, com certeza, facilitará a leitura do restante do livro. Garanto que valerá a pena o esforço, pois além de ser fundamental nesse mundo tecnológico em que vivemos, a teoria eletromagnética é belíssima na sua essência. No texto será usado o Sistema Internacional (SI) de Unidades [metro (m), quilograma (kg), segundo (s) e ampère (A)]. Além de ser o sistema adotado nas aplicações práticas, ele também tem a virtude de realçar os aspectos físicos e matemáticos da teoria eletromagnética nos moldes em que esta será apresentada aqui neste livro1 .
1.2.1
Campos microscópicos - E e B
O conceito de campo eletromagnético é fundamental em eletromagnetismo. Um campo eletromagnético, em uma região Ω de R3 , é um ente formado por dois campos vetoriais2 E e B que satisfazem as equações de Maxwell e cujas fontes são o campo escalar3 ρ e o campo vetorial J. As duas con1
Além do sistema SI existem outros sistemas de unidades, como o CGS e o sistema Lorentz-Heaviside, comuns em livros mais avançados de eletromagnetismo. A interpretação física do eletromagnetismo depende do sistema de unidades adotado. Os exercícios no final do capítulo ajudam a entender isso. 2 Campo vetorial é uma aplicação (função) de uma região Ω de R3 em R3 . Simbolicamente, f : Ω ⊂ R3 → R3 . 3 Campo escalar é uma aplicação (função) de uma região Ω de R3 em R. Simbolicamente, f : Ω ⊂ R3 → R.
4
CAPÍTULO 1. EQUAÇÕES DE MAXWELL
stantes eletromagnéticas 0 e μ0 fazem parte da física e do balanceamento dimensional das equações de Maxwell no SI. No segundo capítulo será visto detalhadamente o que significam campo escalar e campo vetorial do ponto de vista físico-matemático. Os dois campos vetoriais que especificam o campo eletromagnético são: o campo elétrico E (V /m, volts por metro) e o campo de densidade de fluxo magnético B(T , tesla)4 . As fontes de corrente são formadas pela densidade de carga elétrica ρ (C/m3 , coulomb por metro cúbico) e pela densidade de corrente elétrica J (A/m2 , ampères por metro quadrado). As constantes eletromagnéticas são a permissividade elétrica no vácuo 0 = c2 /μ0 (farad por metro) e a permeabilidade magnética no vácuo μ0 = 4π10−7 (henry por metro), sendo a constante c = 299792458 m/s a velocidade da luz no vácuo. A interpretação física do eletromagnetismo é realçada quando se escrevem as equações de Maxwell na forma integral [69]. Maxwell usou este expediente para construir sua teoria [48]. Por isso, vamos iniciar nosso estudo escrevendo as equações de Maxwell desta forma. Mas antes é preciso esclarecer alguns conceitos geométricos em R3 . Visualizemos, então, as duas superfícies orientadas ilustradas na Figura 1.1, denominadas de superfícies de Gauss. A superfície à esquerdo é uma superfície fechada e a do lado direito é uma superfície aberta. A superfície aberta possui uma fronteira, isto significa que existe na borda da superfície uma curva fechada na forma de um aro. A superfície fechada, ao contrário, não tem fronteira, ela, simplesmente, encerra completamente uma região do R3 , formando, ela mesma, a fronteira de uma região tridimensional. Uma superfície orientada significa que ela possui dois lados, um interno e outro externo5 . Além de orientadas vamos exigir que elas sejam suaves6 , isto é, em cada ponto da superfície existe um vetor unitário n ˆ , normal ao plano tangente à superfície nesse ponto, orientado positivamente de dentro para fora. A borda da superfície aberta também é orientada e a sua orientação, identificada pelo vetor tangente ˆ t, é positiva quando percorrendo a borda, o lado esquerdo fica para dentro da curva. De4 Veremos mais adiante que o campo E e o campo B são bem diferentes do ponto de vista físico. O primeiro é um campo de força e o segunda é um campo de fluxo. Por isso, usamos dois tipos diferentes de letras para representá-los. Muitos autores, especialmente os físicos e os geofísicos especializados em geomagnetismo, preferem denominar o campo B de campo magnético em vez de densidade de fluxo magnético e representá-lo pelo símbulo B. 5
Nem todas superfícies são orientáveis, um exemplo famoso é a faixa de Möbius [50], [63]. 6 Na realidade, suave por partes, união de superfícies suaves.
1.2. REPRESENTAÇÕES DAS EQUAÇÕES DE MAXWELL
z
5
z
V V
S S
y x
y x
(a)
(b)
Figura 1.1: Superfícies de Gauss: (a) superfície fechada orientada, (b) superfície aberta orientada. nominamos de S a superfície aberta e de ∂S a sua borda, isto é, a fronteira de S. Do mesmo modo denominamos de V a região do R3 encerrada pela superfície fechada ∂V . Assim, o símbolo ∂ identifica as fronteiras, seja da superfície aberta S ou da região fechada V . Cabe salientar que estas superfícies são objetos matemáticos e portanto virtuais, sem nenhum significado físico, a priori. Desse modo, quando digo visualizar me refiro visualizar na mente, de olhos vendados. Tente isto! Embora virtuais, estas superfícieis desempenham o papel de sensores para se ”detectar ” o campo eletromagnético. Se, à primeira vista, tudo isto parece abstrato, não se desanime. Tudo será devidamente esclarecido nos segundo e terceiro capítulos. De posse das superfícies orientadas que acabamos de idealizar, as equações de Maxwell, em sua formulação mais geral, se escrevem da seguinte maneira, Z Z ρdv, (1.1) ˆds = 0E · n Z
∂V
∂S
∂ B ˆ · tdl − μ0 ∂t
Z
V
Z
0E
ZS
∂ E ·ˆ tdl + ∂t ∂S
·n ˆds =
Z
S
J ·n ˆds,
(1.2)
B·n ˆds = 0,
(1.3)
∂V
B·n ˆds = 0.
(1.4)
S
Z
A primeira equação representa a lei de Coulomb, a segunda, a lei de Ampère, a terceira, a lei de Gauss e a quarta, a lei de Faraday. No terceiro
6
CAPÍTULO 1. EQUAÇÕES DE MAXWELL
capítulo será analisado, detalhadamente, o porquê dessas denominações. Estas equações são absolutamente gerais, são válidas tanto no vácuo quanto em qualquer tipo de meio (isotrópicos, biisotrópicos, anisotrópicos, bianisotrópicos, lineares, lineares simples e não-lineares)7 . Os campos E e B são conhecidos como campos microscópicos. A razão desta denominação é porque eles são expressos em termo de forças (efeitos) e não em termos das fontes (causas). R ˆ As integrais R de linha C f · tdl, integral R acima são de três tipos: integral ˆ ds e integral de volume V pdv. Boa parte do capítulo de superfície S g · n dois será dedicada a estas integrais. É recomendável parar por alguns instantes e apreciar atentamente as quatro equações8 que acabamos de apresentar. Elas formam um conjunto harmonioso e de belíssima simetria. Equações matemáticas não são apenas arranjos embaralhados de símbolos. Muito pelo contrário, elas normalmente transmitem mensagens codificadas de como a natureza funciona. Uma vez entendidas, revelam beleza e simplicidade dos segredos da natureza. Para apreciar isto, é preciso saber decodificar a mensagem contida em qualquer equação e reconhecer precisamente o papel de cada um dos seus símbolos. No próximo capítulo veremos como decodificar as equações de Maxwell. Como recompensa, teremos o prazer de apreciar a simplicidade e coerência destas equações e ao mesmo tempo preparar o terreno para o restante do livro. Observando-se atentamente as equações (1.1 - 1.4), verifica-se que elas formam dois pares de duas equações. O primeiro par é formado pela lei de Coulomb e pela lei de Ampére. O segundo par, pela lei de Gauss e pela lei de Faraday. No primeiro par, (1.1 - 1.2), o campo elétrico E aparece multiplicado por 0 nas integrais de superfície e o campoBdividido por μ0 na integral de linha. Estas combinações 0 E e B/μ0 não são meras operações algébricas. Formam novos campos vetoriais cujas dimensões são C/m2 (coulomb por metro quadrado) e A/m (ampère por metro), respectivamente. As fontes de corrente estão no lado direito do primeiro par de equações. No segundo par não existem fontes e as integrais de linha e de superfícies atuam diretamente nos campos E e B. Note que os campos B/μ0 e E têm algo em comum, eles aparecem nas integrais de linha nas leis de Ampère e de Faraday. Analogamente, 0 E e B aparecem nas integrais de superfícies na lei de Coulomb e na lei de Gauss, respectivamente. Dessas observações vê-se que o segundo par de equações tem a mesma estrutura do primeiro par, com 7
Mais adiante veremos o que significam meios isotrópicos, biisotrópicos, anisotrópicos, bianisotrópicos, lineares, lineares simples e não-lineares. 8 Na realidade são oito equações: uma da lei de Coulomb, três da lei de Ampère, uma da lei de Gauss e três da lei de Faraday.
1.2. REPRESENTAÇÕES DAS EQUAÇÕES DE MAXWELL
7
a ressalva que as fontes de corrente só aparecem no primeiro par. A falta de simetria no lado direito dos dois pares de equações deve-se ao fato de não haver na natureza cargas magnéticas isoladas. Todas essas observações que acabamos de fazer serão minuciosamente analisadas no quarto capítulo do livro. É importante citar que em muitos textos de eletromagnetismo as quatro equações de Maxwell não seguem a mesma seqüência apresentada aqui. É comum encontrar as leis de Faraday e Ampère grafadas em primeiro lugar e as de Coulomb e de Gauss por último. Ou ainda, a lei de Coulomb e a lei de Gauss vêm em primeiro lugar e as de Faraday e Ampère logo em seguida. Há muitas outras combinações em voga. Na verdade há 4! = 24 maneiras diferentes de permutar as equações de Maxwell! Por mera curiosidade eu já fiz uma pesquisa e identifiquei 24 livros textos de eletromagnetismo, um para cada uma dessas permutações. A seqüência apresentada acima, além de sua simplicidade e elegância facilita a interpretação físico-matemática das equações de Maxwell e corrobora com as formulações mais avançadas destas equações9 . Curiosamente ela coincide com a seqüência cronológica no desenvolvimento do eletromagnetismo. Todavia, do ponto de vista computacional não importa a ordem seqüencial das equações.
1.2.2
Campos macroscópicos D e H
Como já foi dito antes, a representação das equações de Maxwell (1.1 - 1.4), em termo dos campos microscópicos E e B, é absolutamente geral. Ela tem a vantagem de ser compacta10 e de desvendar a física do eletromagnetismo numa linguagem matemática simples e elementar. Elas são tão simples e tão concisas que as propriedades elétricas do meio passam por despercebidas. As constantes dimensionais 0 e μ0 representam o vácuo e portanto nada dizem a respeito de qualquer meio físico. Assim, a questão é saber onde as informações sobre o meio interveniente se manifestam.nas equações. É fácil descobrir. Basta observar que as fontes de corrente ρ e J correspondem à totalidade das fontes, externas e internas. No vácuo apenas fontes externas são permitidas. Em qualquer outro meio, cargas elétricas (livres e de 9
No espaço-tempo tetradimensional, o primeiro par forma uma única equação tensorial. O segundo par equivale a uma segunda equação tensorial, [51], [66]. No espaço tridimensional, as duas equações tensoriais se desacoplam nas quatro equações vetoriais apresentadas no texto. Usando-se uma linguagem matemática mais sofisticada as quatro equações vetoriais podem ser reduzir a uma única equação no espaço-tempo tetradimensional, [6], [62]. 10
Veja a nota de rodapé anterior.
8
CAPÍTULO 1. EQUAÇÕES DE MAXWELL
polarização) constituem efetivamente fontes internas. Em outras palavras, os meios, com exceção do vácuo, são constituídos por cargas elétricas que se deslocam na presença de campos eletromagnéticos. Estes deslocamentos podem se dar a grandes distâncias (na escala atômica) ou serem infinitamente pequenos. No primeiro caso, as fontes são chamadas de livres (livres para se deslocar) e no segundo caso são denominadas fontes de polarização. Veremos no quato capítulo que essas fontes de polarização dão origem aos campos eletromagnéticos mascroscópicos D (C/m2 , coulomb por metro quadrado) chamado de densidade de fluxo elétrico e H (A/m, ampère por metro) denominado de campo magnético. Com estes novos campos, veremos que as equações de Maxwell podem ser reescritas da seguinte maneira, Z Z ρf dv (1.5) D·ˆ nds = Z Z∂V ZV ∂ ˆ ds, (1.6) H·ˆ tdl − D·ˆ nds = Jf · n ∂t S ∂S S Z B·ˆ nds = 0, (1.7) ∂V Z Z ∂ ˆ E·tdl + B·ˆ nds = 0, (1.8) ∂t S ∂S em que ρf e Jf são, respectivamente, a densidade de cargas elétricas livres e a densidade de correntes elétricas livres. Note que apenas o primeiro par de equações foi re-arrumado e o segundo não, devido à ausência de fontes. É importante deixar claro que este sistema de equações de Maxwell, (1.5 - 1.8), é absolutamente equivalente ao primeiro sistema (1.1 - 1.4). É interessante observar a equivalência entre as dimensionalidades dos campos D e 0 E e analogamente entre os campos H e B/μ0 .
1.2.3
Meio simples, D = E e B = μH - integral
As equações (1.5 - 1.8) são muito gerais para as aplicações tecnológicas do eletromagnetismo. A razão disto é que as propriedades elétricas e magnéticas dos meios ainda não se fazem transparecer nestas equações. São exatamente as propriedades intrínsecas do meio o elo entre os campos microscópicos E e B e os campos macroscópicos H e D. O inter-relacionamento entre estes campos se faz por intermédio de relações chamadas constitutivas e obviamente elas dependem das características elétricas e magnéticas de cada meio. Em geral, as relações constitutivas são bastante abrangentes e
1.2. REPRESENTAÇÕES DAS EQUAÇÕES DE MAXWELL
9
complexas [37]. Entretanto, nos meios ditos simples as relações constitutivas se reduzem à relações de proporcionalidade do tipo D = E e B = μH [27]. Em muitos casos de interesse prático, os meios se comportam como meios simples. É o caso, por exemplo, dos meios geológicos11 . As ”constantes” elétricas e μ são denominadas, respectivamente, de permissividade elétrica e permeabilidade magnética do meio. A unidade dimensional de é F/m, (farad por metro) e de μ é H/m (henry por metro). O termo ”constante” embora corriqueiro, não é apropriado, pois e μ não são constantes propriamente ditas e sim campos escalares definidos em regiões de R3 . Apenas no vácuo elas são constantes e coincidem numerica e dimensionalmente com 0 e μ0 , respectivamente. Levando em consideração as relações constitutivas para meios simples, as equações (1.5 - 1.8) se reduzem a Z Z E·ˆ nds = ρf dv, (1.9) ∂V Z Z ZV ∂ E·ˆ nds = ˆ ds, (1.10) H·ˆ tdl − Jf · n ∂t S ∂S S Z μH·ˆ nds = 0, (1.11) ∂V Z Z ∂ μH·ˆ nds = 0. (1.12) E·ˆ tdl + ∂t S ∂S É importante atentar que esta versão das equações de Maxwell é muito mais restritiva do que as duas anteriores. Isto é, elas não são equivalentes àquelas. Com efeito, esta nova versão só é válida para meios simples, enquanto que as anteriores são verdadeiras em qualquer situação.
1.2.4
Meio simples, D = E e B = μH - diferencial
Não obstante a forma integral das equações de Maxwell, (1.9 - 1.12) ser, no meu entendimento12 , a formulação mais conveniente de se introduzir o eletromagnetismo, ela, a bem da verdade, não é totalmente apropriada para se resolver problemas práticos de eletromagnetismo. A razão disto é que estes são mais fáceis de serem resolvidos na forma de equações diferenciais. Assim, é preciso transformar as equações de Maxwell da forma integral para 11
No terceiro capítulo discutiremos um pouco mais sobre relações constitutivas mais complexas. 12 A forma integral não só facilita compreender a física do eletromagnetismo como serve de motivação para o desenvolvimento do aparato matemático necessário para se trabalhar com o eletromagnetismo.
10
CAPÍTULO 1. EQUAÇÕES DE MAXWELL
a forma diferencial. Heuristicamente, isto é alcançado tornando as superfícies S e ∂V , da Figura 1.1, arbitrariamente pequenas e usar ferramentas matemáticas apropriadas para proceder o limite. Os capítulos dois e três serão dedicados precisamente a esta questão. Dito isto, vamos adiantar as equações de Maxwell na representação diferencial que correspodem às equações (1.9 - 1.12) na forma integral,
∇ · E = ρf , ∂ E = Jf , ∂t ∇ · μH = 0,
∇×H −
∇×E+
∂μH ∂t
= 0.
(1.13) (1.14) (1.15) (1.16)
Aqui também, a primeira equação é denominada de lei de Coulomb, a segunda é chamada lei de Ampère, a terceira, representa a lei de Gauss e finalmente a quarta é a lei de Faraday. Como ja foi dito, nos segundo e terceiro capítulos veremos como transformar as equações de Maxwell da forma integral, (1.9 - 1.12), para a forma diferencial, (1.13 - 1.16) e como prêmio, teremos oportunidade de desvendar a física do eletromagnetismo. Se as funções que caracterizam os meios ( e μ) forem contínuas e os campos E e H forem diferenciáveis as duas formas - integral (1.9 - 1.12) e diferencial (1.13 - 1.16) - serão absolutamente equivalentes do ponto de vista matemático. Se falhar qualquer uma dessas hipóteses, as equações (1.9 1.12) deixam de ter sentido matemático e por conseqüência perdem sentido físico também. Então, o que fazer neste caso? Recorrer às equações na forma integral, visto que elas funcionam independentemente da continuidade de e μ e de E e H serem ou não diferenciáveis. Em verdade, basta que essas funções sejam contínuas por partes13 para que a forma integral das equações de Maxwell funcione perfeitamente. Fazendo-se as superfícies S e ∂V tenderem para zero, veremos, no terceiro capítulo, que nas regiões onde há descontinuidade de dois meios as
13 A grosso modo, funções contínuas por partes são aquelas com um número finito de descontinuidades limitadas. No segundo capítulo veremos uma definição mais precisa.
1.2. REPRESENTAÇÕES DAS EQUAÇÕES DE MAXWELL
11
equações de Maxwell na forma integral, (1.19 - 1.22), se reduzem a ³
´
= ρs , ³ ´ n ˆ × H1 − H2 = Js , ´ ³ = 0, n ˆ · μ1 H1 − μ2 H2 ³ ´ n ˆ × E1 − E2 = 0. n ˆ·
1 E1 − 2 E2
(1.17) (1.18) (1.19) (1.20)
em que n ˆ é o vetor unitário normal à superfície que separa os dois meios e ρs e Js são as densidades superficiais de cargas e correntes, respectivamente. Os subscritos 1 e 2 indicam os meios limítrofes à superfície de descontinuidade, como ilustra a Figura ??. Observando atentamente as equações (1.17 - 1.20) nota-se que elas lembram as equações (1.13 - 1.16). De fato, basta substituir o operador nabla ∇ pelo vetor n ˆ , fazer ∂/∂t igual a zero, substituir Jf e ρf por Js e ρs e considerar no lugar dos campos a sua diferença. Na literatura, as equações de Maxwell (1.17 - 1.20) são denominadas de condições de fronteiras entre dois meios de propriedades elétrica e magnética distintas. De todo que foi dito, chegamos à seguinte conclusão. A forma integral das equações de Maxwell é o ponto de partida para a dedução das equações na forma diferencial e das condições de fronteiras. Estas como já foi dito, são as equações que efetivamente são usadas na solução de problemas de eletromagnetismo. Assim, a partir de agora vamos nos concentrar apenas na forma diferencial das equações de Maxwell e nas condições de fronteiras. Neste capítulo, não precisamos mais das equação de Maxwell na forma integral. Por enquanto, elas já fizeram a sua parte.
1.2.5
Domínio do tempo: E (t) e H (t)
As equações (1.13 - 1.16) ainda são bastante gerais para os objetivos deste livro. Precisamos, por exemplo, identificar qual o termo que representa a antena transmissora de energia eletromagnética. Em geofísica, esta questão é de suma importância, uma vez que o uso do transmissor é fundamental para a ”comunicação” com a terra. A densidade de corrente Jf pode ser decomposta em duas partes. Uma, denominada de JT x , que energiza a antena do transmissor e a outra parte, Ji , que flui dentro do meio onde o campo eletromagnético se propaga. Esta segunda parte, chamada de correntes induzidas,.são de dois tipos: corrente
12
CAPÍTULO 1. EQUAÇÕES DE MAXWELL
Meio 2
s 2
m
s
m
2
1
1
Meio 1
Figura 1.2: Descontinuidades de superfície suave.
e μ entre dois meios separados por uma
de deslocamento e correntes de condução ou ôhmicas. Os meios onde as correntes de deslocamto sobressai às ômicas, são chamados de dielétricos. Caso contrário, são chamados de condutores. Nos bons condutores a permissivida elétrica é praticamente igual a 0 , enquanto que as correntes de condução satisfazem a lei de Ohm, Ji = σ E, em que σ é a condutividade do meio em siemens por metro (S/m). Como foi dito acima, as equações (1.13 - 1.16) são ainda muito genéricas para os nossos objetivos. Para simplificá-las vamos supor que as propriedades e μ não variam com o tempo. Esta hipótese é bastante razoável, principalmente em geofísica. Assim, podemos, finalmente, escrever, ∇ · E = ρf , ∇×H −
∂E − σ E = Jtx , ∂t ∇ · μH = 0,
∇×E+μ
∂H ∂t
= 0.
(1.21) (1.22) (1.23) (1.24)
em que a densidade de corrente Jf foi desdobrada em Jtx + σ E. Normalmente nos meios condutivos a permissividade é praticamenteAs equações de condições de fronteiras (1.17 - 1.20) não precisam ser modificadas. Mas, é preciso que se faça uma resalva. Embora a condutividade σ não apareça diretamente nas equações de condições de fronteiras, ela indiretamente interfere no comportamento do campo elétrico E na interface
1.2. REPRESENTAÇÕES DAS EQUAÇÕES DE MAXWELL
13
de dois meios de condutividades diferentes. Descontinuidade nas condutividades geram cargas nas interfaces dos meios e por conseqüência a componente normal do campo elétrico é descontínua na interface, mesmo sendo contínuas a permissividade elétrica e a permeabilidade magnética dos dois meios. Descontinuidade em σ resulta em acúmulo de cargas na interface de descontinuidade. O termo ρs em (1.17) também leva em conta essas cargas, mesmo que seja contínua. Em geofísica os efeitos das descontinuidades na condutividade são muito mais proeminentes do que os da permissividade elétrica e da permeabilidade magnética. Ademais, se as condutividades dos dois meios forem finitas, como é o caso em geofísica, a densidade de corrente de superfície Js é identicamente nula. Dito isto, vamos repetir as equações (1.17 - 1.20), ³ ´ n ˆ· 1 E1 − 2 E2 = ρs , (1.25) ´ ³ = 0, (1.26) n ˆ × H1 −H2 ³ ´ n ˆ · μ1 H1 − μ2 H2 = 0, (1.27) ³ ´ n ˆ × E1 − E2 = 0. (1.28)
A exemplo de e μ, a condutividade elétrica σ geralmente não varia com o tempo, embora em alguns casos isolados isto pode acontecer. Via de regra, as correntes Jtx injetadas no transmissor variam com o tempo. Quando a variação temporal de Jtx é do tipo pulsos de corrente costuma-se dizer que o problema está no domínio do tempo. No caso particular em que JT x , E e H são independentes do tempo, as equações de Maxwell se desacoplam em equações mais simples dando origem à magnetostática. No caso extremo de haver somente cargas estacionárias, apenas o campo elétrico sobrevive e neste caso tudo se resume à eletrostática.
1.2.6
Domínio da freqüência: E (ω) e H (ω)
A riqueza do eletromagnetismo está na variação temporal das correntes e dos campos elétrico e magnético. Entretanto, na maioria dos problemas práticos de eletromagnetismo a variação temporal de JT x (t) é bem simples. Senoidal, por exemplo. Além de sua simplicidade, a variação senoidal pode ser usada para reconstituir qualquer pulso de corrente. Por isso, a variação senoidal desempenha papel importantíssimo em eletromagnetismo. Em virtude da linearidade das equações de Maxwell, se JT x (t) é senoidal, os campos elétrico e magnético também o são. Nesse caso se diz que eles estão no domínio
14
CAPÍTULO 1. EQUAÇÕES DE MAXWELL
da freqüência ou que os campos são harmônicos [27]. Para distinguir um domínio do outro, vamos usar letras maiúsculas em negrito, sem seta, para expressar as correntes Jtx e os campos E e H no domínio da freqüência. Para distinguir a densidade de cargas livres nos dois domínios usaremos, simplesmente, os símbolos ρf no domínio do tempo e ρf (ω) no domínio da freqüência. No terceiro capítulo será visto que no domínio do tempo a derivada com relação ao tempo é equivalente a multiplicar pelo fator iω, no domínio da freqüência. Aqui, ω significa freqüência angular (radianos por segundo) e i é a constante imaginária (i2 = −1). Veremos também como transformar as equações de Maxwell de um domínio para o outro. Feitas essas observações, as equações de Maxwell (1.21 - 1.24), no domínio de freqüência, têm a seguinte aparência, ∇ · E = ρf (ω) ,
∇ × H − (σ + iω ) E = JT x , ∇ · μH = 0,
∇ × E + iωμH = 0.
(1.29) (1.30) (1.31) (1.32)
Analogamente, as relações de fronteiras (1.25 - 1.28) se transformam em n ˆ · ( 1 E1 −²2 E2 ) = qs (ω) ,
(1.33)
n ˆ × (H1 −H2 ) = 0,
(1.34)
n ˆ × (E1 −E2 ) = 0.
(1.36)
n ˆ · (μ1 H1 − μ2 H2 ) = 0,
(1.35)
Para concluir, é oportuno observar que as equações de Maxwell no domínio do freqüência são bem mais simplificadas que todas outras anteriores no domínio do tempo. Isto será visto detalhadamente no quaro capípulo.
1.3
Sumário
Na segunda metade do século XIX foram propostas várias teorias para explicar numa única abordagem os fenômenos elétricos, magnéticos e óticos, até então conhecidos. Entre todas elas, a de Maxwell é a mais popular por sua simplicidade e versatilidade, tanto do ponto de vista teórico como prático. Inicialmente, Maxwell propôs vinte equações que posteriormente, após a sua morte, aos 48 anos, foram reescritas por Heaviside em oito equações que deram origem as quatro equações vetoriais universalmente
15
ios Simples e M nio do Tem mí í
ü
c ia
Do m
d a Fr e q
ên
nio
po
Do
Cam
cro e Macro i sc sM
icos óp
po
1.3. SUMÁRIO
Figura 1.3: Diagrama das simplificações sucessivas das equações de Maxwell. conhecidas como equações de Maxwell. Estas equações podem ser representadas tanto na forma integral como diferencial. A forma integral é mais conveniente para visualizar o conteúdo físico das equações. Por outro lado, a representação diferencial é mais vantajosa para se fazer os cálculos Neste primeiro capítulo, fizemos um vôo panorâmico sobre as equações de Maxwell. Nos dois próximos capítulos aterrissaremos para apreciar os detalhes. No vôo panorâmico foram apresentadas cinco versões das equações de Maxwell. A primeira versão tratou apenas dos campos microscópicos E e B, sem levar em consideração nenhuma informação, a priori, sobre as propriedades elétricas e magnéticas dos meios intervenientes. Na segunda versão os meios já se fazem presentes por meio dos campos macroscópicos D e H, embora ainda de modo camuflado. Estas duas versões são absolutamente equivalentes e são demasiadamente gerais para os nossos objetivos. Por isso, na Figura 1.3, o círculo correspondente a estas duas versões abrange todos os demais círculos ligados às versões mais especializadas. As equações da terceira versão são bem mais restritivas, porque elas só funcionam em meios lineares simples, enquanto que as das duas versões anteriores são válidas para quaisquer tipo de meio. Nesta terceira versão as equações de Maxwell são apresentadas tanto na forma integral como na
16
CAPÍTULO 1. EQUAÇÕES DE MAXWELL
forma diferencial. Nos meios em que as fontes são contínuas as duas formulações são equivalentes. Se isto não acontece, a forma integral continua válida mas a diferencial não. É preciso nesse caso complementar as equações na forma diferencial com as condições de fronteira, as quais nada mais são do que o limite das equações de Maxwell na forma integral na vizinhança de pontos de descontinuidade das fontes internas do meio. Assim, para se resolver um problema típico de eletromagnetismo usam-se as equações de Maxwell na forma diferencial complementadas pela condições de fronteira onde o meio apresenta descontinuidades em suas propriedades elétricas e ou magnéticas. Na quarta versão, além das propriedades e μ, a condutividade σ também entra em jogo. Isto se deve à separação das correntes livres Jf em correntes induzidas, Ji = σ E, no meio e nas correntes JT x no transmissor. Em muitas aplicações as correntes no transmissor são do tipo pulsos de correntes. Usa-se o termo domínio do tempo quando a energização é deste tipo. Em virtude desta particularidade a quarta versão é mais simplificada que as anteriores, em que a variação temporal é geral. Na última versão, a mais simplificada de todas, as equações de Maxwell também envolve o tempo, porém de maneira bastante especial. O tempo, agora, varia de forma senoidal com uma freqüência fixa, e por isso se diz que as equações estão no domínio da freqüência. O mais interessante de tudo isso é que em muitos casos a solução de um problema no domínio do tempo se reduz a vários problemas simples no domínio da freqüência. Sinceramente, é possível que o leitor, principalmente os iniciantes ao eletromagnetismo, não tenha absorvido completamente todas as nuanças discutidas neste primeiro capítulo. Mas, eu espero que o leitor esteja agora suficientemente motivado para juntos descobrirmos os segredos do eletromagnetismo. Afinal de contas o propósito deste primeiro capítulo é servir de motivação para o desenvolvimento dos dois próximos capítulos. Lá, tenho certeza que tudo ficará transparente, claro como o dia!
1.4
Exercícios
1. No Sistema Internacional de medidas usa-se os símbolos L (metro), M (quilograma), T (segundo) e A (ampère) para representar as unidades de comprimento, massa, tempo e corrente, respectivamente. Sabendose que força é massa vezes aceleração (segunda lei de Newton), que campo elétrico é força por unidade de carga e que corrente é carga por unidade de tempo:
1.4. EXERCÍCIOS
17
• Verifique que a representação dimensional de campo elétrico E é M LT −3 A−1 (volt/m), • Use a lei de Faraday (1.4) para mostrar que a representação dimensional da densidade de fluxo magnético B é M T −2 A−1 (tesla), • Use a lei de Coulomb (1.1) para mostrar que a representação dimensional de 0 é M −1 L−3 T 4 A2 (farad/m) • Use a lei de Ampère (1.2) para mostrar que a representação dimensional μ0 é M LT −2 A2 (henry/m) • Use estes resultados e conclua que as representações dimensionais de 0 E e B/μ0 são, respectivamente, L−2 T A (coulomb/m2 ) e L−1 A (ampère/m). O objetivo desse exercício é convencer o leitor que os campos vetoriais 0 E e B/μ0 são fisicamente diferentes dos campos E e B. Esta diferença é crucial para o entendimento do significado físico das equações de Maxwell. 2. Em analogia com as equações (1.13 - 1.16), justifique que na formação diferencial as equações (1.1 - 1.4) correspondem a 0E
= ρ,
(1.37)
∂ 0E B − μ0 ∂t
= J,
(1.38)
∇ · B = 0,
(1.39)
= 0,.
(1.40)
∇·
∇×
∇×E+
∂B ∂t
Sugestão: em matemática e especialmente em física é muito importante ser hábil no reconhecimento de padrões, analogias, simetrias etc. Use a sua criatividade! 3. Repita o exercício 1 usando no lugar das equações (1.4), (1.1) e (1.2) as equações (1.40), (1.37) e (1.38). 4. No sistema de unidades CGS — centímetro, grama, segundo, ues (unidade eletrostática) e uem (unidade eletromagnética) — as equações de Maxwell
18
CAPÍTULO 1. EQUAÇÕES DE MAXWELL (1.1 - 1.4) se escrevem assim: Z Z
∂S
Z
∂V
B ·ˆ tdl −
1∂ c ∂t Z
1∂ E ·ˆ tdl + c ∂t ∂S
Z
S
E·n ˆds = 4π E·n ˆds =
4π c
Z
ZV
S
ρdv,
(1.41)
J ·n ˆ ds,
(1.42)
B·n ˆds = 0,
(1.43)
∂V
B·n ˆds = 0.
(1.44)
S
Z
em que V e S são as mesma superfícies ilustradas na Figura ??. O símbolo c representa a velocidade da luz no vácuo. O campo E é denominado campo elétrico e o campo B é comumente chamado de campo magnético. A unidade de campo elétrico é gauss. E a do campo magnético? Analise cuidadosamente as equações (1.41 - 1.44) antes de responder a esta questão. 5. Com base no exercício anterior quais as unidades dos campos macroscópicos D e H no sistema CGS? 6. Em analogia com o sistema SI justifique que no sistema CGS, as equações de Maxwell na forma diferencial correspondentes às equações (1.41 - 1.44) são ∇ · E = 4πρ,
∇×B−
∇×E+
4π 1 ∂E = J, c ∂t c ∇ · B = 0, 1 ∂B c ∂t
= 0.
(1.45) (1.46) (1.47) (1.48)
7. Mostre que no vácuo e na ausência de fontes externas, as equações de Maxwell (1.45 - 1.48), no sistema de unidades CGS se reduzem a ∇ · E = 0,
∇×B−
∇×E+
1 ∂E = 0, c ∂t ∇ · B = 0, 1 ∂B c ∂t
= 0.
(1.49) (1.50) (1.51) (1.52)
1.4. EXERCÍCIOS
19
Note a perfeita simetria, a menos de um sinal. (lei de Coulomb ←→ lei de Gauss; lei de Ampère ←→ lei de Faraday). 8. Mostre que no SI as equações de Maxwell (1.37 - 1.40), no vácuo e na ausência de fontes externas têm a seguinte forma: ∇ · E = 0,
1 ∂E = 0, c ∂t ∇ · cB = 0,
∇ × cB −
∇×E+
1 ∂cB c ∂t
= 0.
(1.53) (1.54) (1.55) (1.56)
e portanto, são simétricas também. Para os físicos, a presença de simetria é um dos dotes essenciais da natureza. 9. Continuando o exercício anterior, mostre que na presença de fontes as equações de Maxwell no SI podem ser escritas assim: ∇ · E = ( 0 c)−1 (ρc) ,
1 ∂E = ( 0 c)−1 J, c ∂t ∇ · cB = 0,
∇ × cB −
∇×E+
1 ∂cB c ∂t
= 0.
(1.57) (1.58) (1.59) (1.60)
Qual a unidade SI do termo ( 0 c)−1 ? 10. Mostre que no SI, a razão entre E (ω) e H (ω) é a mesma de ( 0 c)−1 . 11. Verifique que no sistema natural de unidades de Heaviside-Lorentz, em que c = 1 = 0 (adimensional), as equações de Maxwell são expressas assim: ∇ · E = ρ,
∂E = J, ∂t ∇ · B = 0,
∇×B−
∇×E+
∂B ∂t
= 0.
(1.61) (1.62) (1.63) (1.64)
20
CAPÍTULO 1. EQUAÇÕES DE MAXWELL
12. Justifique com base nos exercícios acima que o sistema CGS e o sistema de Heaviside-Lorentz podem ser vistos como casos especiais do SI. 13. Sabendo-se que ∇ · ∇ × E = 0, mostre que num meio homogêneo a lei de Gauss está contida na lei de Faraday. Sugestão: use as equações (1.31 - 1.32). 14. Em analogia ao exercício anterior e sabendo-se que ∇ · ∇ × E = 0, será que a lei de Coulomb está contida na lei de Ampère? Sugestão: use as equações (1.29 - 1.30). 15. Mostre que num meio homogêneo (σ, e μ constantes) e sem fontes externas, as quatro equações de Maxwell no domínio da freqüência (1.29 - 1.32) se resumem a ∇ × H − (σ + iω ) E = 0,
∇ × E + iωμH = 0.
(1.65) (1.66)
Capítulo 2
Cálculo Vetorial 2.1
Introdução
É impressionante que com apenas quatro equações1 pode-se deduzir absolutamente tudo sobre eletricidade, magnetismo, radiação eletromagnética e ótica. Isto se deve ao fato que por trás das quatro equações de Maxwell se esconde uma linguagem matemática especificamente construída para lidar com o eletromagnetismo. É isto mesmo, é a pura verdade! Boa parte do cálculo vetorial foi desenvolvida, nas últimas décadas do século XIX, para destrinchar a teoria eletromagnética deixada por Maxwell, ([30], [32], [84]). Naquela época, o cálculo vetorial ainda não existia como tal e o eletromagnetismo foi o grande impulsionador para que ele tomasse forma e se desenvolvesse2 . Compreender cada termo, cada símbolo que compõe as equações de Maxwell é o ponto de partida para quem almeja familiarizar-se com o eletromagnetismo. Não é preciso ir muito longe, a linguagem se resume a alguns poucos itens de matemática, dos quais destacam-se: integrais de linha e de superfície de campos vetoriais e integrais de volume de campos escalares; os operadores: rotacional, divergência e gradiente; os teoremas de Stokes, de Gauss e de Green e por fim, algumas noções básicas sobre as séries e transformadas de Fourier 3 . Este capítulo tem por objetivo fazer uma revisão sucinta destes tópicos. Mais importante que o rigor matemático é a interpretação física de cada um destes assuntos. Por isso, a ênfase será 1
Na verdade, são oito equações escalares reunidas em quatro equações vetoriais. No quarto capítulo contaremos um pouco desta fascinante história. 3 Outros tópicos de matemática serão adicionados a esta lista no decorrer do livro. Por enquanto, estes são suficientes para a decodificação das equações de Maxwell. 2
21
22
CAPÍTULO 2. CÁLCULO VETORIAL
na concepção física, voltada sempre para o eletromagnetismo. Os detalhes matemáticos e operacionais ficarão a cargo do Mathematica4 que é um sistema sofisticado de software de computação simbólica, numérica e gráfica que facilita imensamente o trato com questões matemáticas na ciência e na tecnologia.
2.2
Campo Vetorial e Campo Escalar
Os conceitos de campo vetorial e de campo escalar são fundamentais em eletromagnetismo. Para se saber, realmente, do que se tratam estes objetos, é preciso, em primeiro lugar, caracterizar o que seja um vetor. É exatamente esta a nossa primeira tarefa.
2.2.1
Vetores
Definimos5 um vetor geométrico tridimensional, ou simplesmente vetor, como sendo um terno (x1 , x2 , x3 ) de números reais. Denotamos um vetor geométrico por uma letra minúscula em negrito. Exemplos: e = ( √13 , 7, π). O vetor x = (x1 , x2 , x3 ) também pode ser escrito assim x = (x, y, z). Se c é um número real e a = (a1 , a2 , a3 ) um vetor, definimos ca como sendo o vetor (ca1 , ca2, ca3 ). Dados o vetor a = (2, −3, 8) e o número c = 9, então ca = (18, −27, 72). A constante real c é denominada escalar. Vejamos agora como adicionar vetores. Se a e b são dois vetores, digamos, a = (a1 , a2 , a3 ) e b = (b1 , b2 , b3 ), então definimos a + b como sendo√o vetor (a1 + b1 , a2 + b2 , a3 + b3 ).√Por exemplo, dados a = (−1, π, 5) e b = ( 2, 4, −3), então a + b = (−1 + 2, π + 4, 2). Observa-se que as seguintes regras da adição são satisfeitas: • (a + b) + c = a + (b + c), • a + b = b + a, • c(a + b) = ca + cb, • Se c1 e c2 são escalares, então (c1 +c2 )a = c1 a+c2 a e (c1 c2 )a = c1 (c2 a) , 4 Para facilitar a leitura do texto, usaremos o artigo masculino ”o” para indicar o sistema Mathematica e o artigo feminino ”a” quando se referir à matemática propriamente dita. 5 Uma definição mais ampla de vetor será vista no oitavo capítulo, com a introdução dos espaços vetoriais. Até lá, esta definição provisória de vetor satisfaz plenamente aos nossos objetivos imediatos.
2.2. CAMPO VETORIAL E CAMPO ESCALAR
23
• Seja 0 = (0, 0, 0), então 0 + a = a + 0 = a, ∀ a, • Seja −a = (−1)a então a + (−a) = 0. Os símbolos x, y e z que formam o vetor (x, y, z) são denominados de componentes do vetor. O conjunto de todos os vetores (tridimensionais) é denominado de R3 , também conhecido como o espaço tridimensional. No caso particular em que a terceira componente é identicamente igual a zero, o vetor (x, y, 0) assume a forma bidimensional (x, y). O conjunto de todos os vetores bidimensionais é denotado de R2 e é geometricamente identificado como o plano. Da mesma maneira, se as duas últimas componentes do vetor são identicamente nulas, o vetor (x, 0, 0) adquire a forma unidimensional (x) ou simplesmente x, sem parêntese. O conjunto desses vetores unidimensionais se confunde com o próprio conjunto R dos números reais, conhecido como a reta. Neste último caso é preciso não confundir um vetor x com a componente x e com um escalar x.
z
z a
(x, y, z)
y x
(a)
y x
(b)
Figura 2.1: Visualização geométrica de um vetor: (a) representação de um ponto no espaço (b) um segmento de reta orientado. Em virtude das três primeiras regras de adição que acabamos de ver, pode-se reescrever um vetor de R3 da seguinte maneira: a = (a1 , a2 , a3 ) = a1 (1, 0, 0) + a2 (0, 1, 0) + a3 (0, 0, 1) ou mais sucintamente ˆ a = a1 î + a2ˆj + a3 k, ˆ = (0, 0, 1) são denotados vetores unitários, em que î = (1, 0, 0), ˆj = (0, 1, 0), k também chamados de vetores canônicos.
24
CAPÍTULO 2. CÁLCULO VETORIAL
Do ponto de vista geométrico, um vetor pode ser interpretado de duas maneiras distintas: (a) um ponto no espaço tridimensional e (b) um segmento de reta orientado, como ilustra a Figura 2.1. A interpretação geométrica é um recurso que facilita a visualização de quantidades físicas representadas por vetores. É apenas uma imagem hipotética. O que realmente deve ser levado em consideração são as propriedades algébricas do vetor. Dependendo da motivação física que se tem no momento, escolhe-se uma ou outra interpretação geométrica. Em eletromagnetismo teremos oportunidade de usar freqüentemente ambas representações.
2.2.2
Produto escalar e produto vetorial
Além das operações de adição de vetores e produto de um vetor por um escalar há duas outras operações com vetores que são muito importantes em eletromagnetismo. Uma é denominada de produto escalar, também chamado de produto interno, e a outra, é conhecida como produto vetorial ou produto externo. Vejamos, primeiro, o produto escalar6 . Dados os vetores a = (a1 , a2 , a3 ) e b = (b1 , b2 , b3 ) define-se o produto escalar ou produto interno de a e b da seguinte maneira: a · b = a1 b1 + a2 b2 + a3 b3 .
(2.1)
O produto escalar satisfaz as seguintes propriedades: • a · b = b · a, • a· (b + c) = a · b + a · c = (b + c) ·a, • Se c é um escalar, então (ca) ·b = c (a · b) = a· (cb) , • Se a = 0 é o vetor nulo, então a · a = 0, se não a · a > 0. Diretamente relacionado ao conceito de produto interno destaca-se o de norma de um vetor. A norma ou módulo de um vetor a = (a1 , a2 , a3 ), simbolizada por kak, é o escalar: q √ kak = a · a = a21 + a22 + a23 . (2.2) 6
Uma definição mais ampla do produto interno será dada no oitavo capítulo.
2.2. CAMPO VETORIAL E CAMPO ESCALAR
25
A norma nada mais é do que o comprimento geométrico do vetor. Notese que kak 6= 0 se a 6= 0. O co-seno do ângulo entre dois vetores a e b é definido pela seguinte relação: a·b . (2.3) cos θ = kak kbk É instrutivo verificar que esta identidade é consistente com o conceito intuitivo de ângulo entre dois vetores interpretados geometricamente. Com efeito, tomemos dois vetores não colineares a = (a1 , a2 ) e b = (b1 , b2 ) no plano xy como ilustra a Figura 2.2.
y b a
b
2
a
2
b a
b
1
a
1
x
Figura 2.2: Dois vetores não colineares do plano xy. Observando-se a Figura 2.2 tem-se cos θa =
a1 a2 b1 b2 , sin θa = , cos θb = e sin θb = . kak kak kbk kbk
(2.4)
Substituindo estas quatro expressões na identidade trigonométrica, cos θ = cos (θb − θa ) = cos θa cos θb + sin θa sin θb , resulta cos θ =
a1 b1 a2 b2 + . kak kbk kak kbk
Lembrando-se que a · b = a1 b1 + a2 b2 , a expressão acima se reduz a a · b = kak kbk cos θ,
26
CAPÍTULO 2. CÁLCULO VETORIAL
e portanto, idêntica à fórmula (2.3). Com um pouco de imaginação e visão espacial, pode-se estender o mesmo raciocínio a dois vetores co-planares tridimensionais. Dois vetores não nulos são perpendiculares se, e somente se7 , a · b = 0. De fato, como kak e kbk são ambas diferentes de zero, conclui-se de (2.3) que θ é igual a π/2. Por outro lado, se θ = π/2, então, a · b = 0 em virtude de (2.3). De posse do produto interno, vejamos, agora, do que se trata o produto externo ou vetorial. O produto vetorial de dois vetores definido pela expressão
a = (a1 , a2 , a3 ) e b = (b1 , b2 , b3 ) é
a × b = (a2 b3 − a3 b2 , a3 b1 − a1 b3 , a1 b2 − a2 b1 ) ,
(2.5)
em que o vetor a × b é perpendicular ao plano que contém os vetores a e b, e cuja orientação segue a regra da mão direita, a ser descrita mais adiante. Ao contrário do produto interno que é um escalar, o produto vetorial é um vetor8 . O produto vetorial é fundamental no estudo do eletromagnetismo. Por isso, apresentaremos agora uma discrição geométrica para esclarecer a definição (2.5). Sejam a e b dois vetores não nulos no plano xy que formam entre si um ângulo θ 6= 0, como ilustra a Figura 2.3. Substituindo os valores dos senos e co-senos fornecidos pelas expressões (2.4) na identidade trigonométrica: sin θ = sin (θb − θa ) = sin θb cos θa − sin θa cos θb , resulta sin θ = ou, simplesmente,
a2 b1 a1 b2 − , kak kbk kak kbk
a1 b2 − a2 b1 = kak kbk sin θ.
(2.6)
O lado direito desta expressão corresponde à área do paralelogramo ilustrado na Figura 2.3 e o lado esquerdo é idêntico à terceira componente do 7 A locução ”se, e somente se”, significa que dadas duas hipóteses p e q, p implica q e q implica p. Em outras palavras, p e q são condições necessárias e suficientes para que ambas sejam verdadeiras. Definições, normalmente, satisfazem a condição ”se, e somente se”. 8 Na realidade trata-se de um pseudovetor no jargão da matemática mais avançada, [66]. Aqui não é preciso distinguir vetor, de pseudovetor.
2.2. CAMPO VETORIAL E CAMPO ESCALAR
27
produto vetorial (2.5). Em outras palavras, a área do paralelogramo cujos lados são os vetores a e b é igual a norma do vetor (0, 0, a1 b2 − a2 b1 ). Notese que a orientação do ângulo θ é no sentido de a para b. Se o sentido fosse invertido, de b para a, o lado esquerdo da equação (2.6) teria sinal contrário e por conseqüência o vetor correspondente à área do paralelogramo tornarse-ia (0, 0, −a1 b2 + a2 b1 ). Em resumo, o produto vetorial de dois vetores a e b, não nulos, no plano xy, que formam um ângulo θ 6= 0 entre si é um vetor igual a (0, 0, a1 b2 − a2 b1 ). Portanto, o produto vetorial de dois vetores co-planares no plano xy é um vetor situado no eixo z, ou seja, perpendicular ao plano xy, e cuja orientação é positiva ou negativa conforme o ângulo θ seja de a para b ou de b para a, respectivamente.
y b a
b
2
a
2
b a
b
1
a
1
x
Figura 2.3: Representação gráfica da norma do produto vetorial dos vetores a e b no plano xy. Se em vez do plano xy, os vetores a e b estivessem assentados no plano xz, a área do paralelogramo seria, usando o mesmo raciocínio anterior, igual a (0, a3 b1 − a1 b3 , 0). Então, o produto vetorial seria um vetor, de norma igual a a3 b1 − a1 b3 , na direção do eixo y orientado de acordo com o sentido do ângulo formado pelos dois vetores. Analogamente, se os dois vetores a e b estivessem no plano yz o produto vetorial seria (a2 b3 − a3 b2 , 0, 0) . Sabendo-se que um vetor qualquer pode ser decomposto em três vetores ortogonais aos planos cartesianos, segue da definição (2.5) que o produto vetorial nada mais é que a composição desses três casos particulares9 . Feitas essas considerações, podemos concluir que o produto externo de dois vetores 9
Contrário ao produto escalar, cuja definição pode ser estendida facilmente para vetores de Rn (veja a página 32), o produto vetorial de dois vetores é uma operação restrita a vetores d R3 . Não há sentido falar de produto vetorial de vetores do R4 , por exemplo. Por
28
CAPÍTULO 2. CÁLCULO VETORIAL
não colineares é um terceiro vetor perpendicular ao plano que contém os dois primeiros e cuja norma é igual à área do paralelogramo formado por ambos. O sinal do produto vetorial depende da orientação do ângulo entre os dois vetores dados. Uma maneira prática de determinar o sinal do produto vetorial é a chamada regra da mão direita, ilustrada na Figura 2.4.
z
a
b
z a
b
a
a
y x
b
b
y x
Figura 2.4: Ilustração da regra da mão direita A regra da mão direita nos diz que o dedo polegar da mão direita indica a direção e o sentido do produto vetorial a × b, enquanto os demais dedos acompanham a rotação do primeiro para o segundo vetor. A expressão (2.5) que define o produto vetorial é de difícil memorização. Um artifício prático para se ter de cor a fórmula do produto vetorial é desenvolver formalmente o seguinte "determinante", ¯ ¯ ˆ ¯ ¯ î ˆj k ¯ ¯ a × b = (a1 , a2 , a3 ) × (b1 , b2 , b3 ) = ¯¯ a1 a2 a3 ¯¯ . ¯ b1 b2 b3 ¯
(2.7)
O Mathematica simplifica extraordinariamente a manipulação simbólica e numérica de vetores. Um vetor no Mathematica é simplesmente uma lista de três expressões simbólicas ou numéricas entre chaves { }, no lugar dos tradicionais parênteses ( ) usados na matemática. A lista de manuais e livros básicos que tratam de vetores, com ênfase no Mathematica, é muito essa e outras razões, ainda mais fundamentais, o cálculo vetorial é inadequado para lidar com o eletromagnetismo avançado. Neste caso, ele é substituído pelo cálculo tensorial ou pelo cálculo das formas diferenciais. Há quem diga que o eletromagnetismo ilumina as formas diferenciais e estas iluminam o eletromagnetismo, [62].
2.2. CAMPO VETORIAL E CAMPO ESCALAR
29
vasta, dos quais destacamos: [22], [46], [16],[54], [68], [64], [86]. Para uma rápida introdução ao Mathematica consulte o Apêndice B no final do livro. Vejamos, agora, alguns exemplos de operações com vetores com o Mathematica. Exemplo 2.1: A adição simbólica dos vetores (a1 , a2 , a3 ) e (b1 , b2 , b3 ) é muito simples. De fato, basta teclar os comandos: In[1]:= (*--- Adição de vetores ---*) Clear[a1, a2, a3, b1, b2, b3] a = {a1, a2, a3}; b = {b1, b2, b3}; a + b Out[4]:= {a1 + b1, a2 + b2, a3 + b3}
√ ¢ ¡ ¡ ¢ A adição de 2, π, 2 e −3, 13 , 1 é feita da mesma maneira: In[5]:= (*--- Adição de vetores ---*) a = {2, Pi, Sqrt[2]}; b = {-3, 1/3, 1}; a + b √ In[7]:= {−1, 1/3 + π, 1 + 2}
O produto do vetor simbólico (a1 , a2 , a3 ) pelo escalar c: In[8]:= (*--- Multiplicação de um vetor por um escalar ---*) Clear[a1, a2, a3, c] a = {a1, a2, a3}; ca Out[10]:= {c a1, c a2, c a3}
√ ¢ ¡ O produto do vetor 2, π, 5 pelo escalar c = −7:
In[11]:= (*--- Multiplicação de um vetor por um escalar ---*) a = {2, Pi, Sqrt[5]}; c = -7 √ Out[13]:= {−14, −7π, −7 5}
O produto escalar de a = (a1 , a2 , a3 ) e b = (b1 , b2 , b3 ) é executado com o comando a.b: In[14]:= (*--- Produto interno ---*)
30
CAPÍTULO 2. CÁLCULO VETORIAL Clear[a1, a2, a3, b1, b2, b3] a = {a1, a2, a3}; b = {b1, b2, b3}; a·b Out[17]:= a1 b1 + a2 b2 + a3 b3
√ ¢ ¡ ¡ ¢ O produto interno de 5, 23 , π 2 e 2, −1, 13 : In[18]:= (*--- Produto interno ---*) a = {5, 2/3, Pi Sqrt[2]}; b = {2, -1, 1/3}; a·b √ Out[20]:= 28/3 + 2π/3
A norma do vetor a = (a1 , a2 , a3 ) é a raiz quadrada do produto escalar a · a. Então: In[21]:= (*--- Norma do vetor a ---*) Clear[a1, a2, a3] a = {a1, a2, a3}; Sqrt[a a] s a21 + a22 + a23 Out[23]:=
√ ¢ ¡ A norma do vetor a = 5, 23 , π 2 :
In[24]:= (*--- Norma do vetor a ---*) a = {5, 2/3, Pi Sqrt[2]}; Sqrt[a a] s 229/9 + 2π2 Out[25]:=
Para se transformar as componentes do vetor a da célula In[24] da forma simbólica para valores decimais, basta executar o comando N[a]. Portanto, In[26]:= (*--- Valor numérico do vetor a ---*) N[a] Out[26]:= {5, 0.666667, 4.44388}
O comando N[a] registra seis dígitos significativos, como padrão. Para aumentar ou diminuir o número de dígitos significativos usa-se o comando N[a, n], sendo n o número de dígitos desejados. Exemplos:
2.2. CAMPO VETORIAL E CAMPO ESCALAR
31
In[27]:= (*--- Valor numérico do vetor a ---*) N[a, 25] Out[27]:= {5.0000000000000000000000000, 0.6666666666666666666666667 4.442882938158366247015881}
In[28]:= (*--- Valor numérico do vetor a ---*) N[a, 2] Out[28]:= {5.0, 0.67, 4.4}
O valor numérico de kak é calculado com o comando: In[29]:= (*--- Valor numérico da norma do vetor a ---*) N[Sqrt[a·a] Out[29]:= 6.72188
O produto vetorial de a = (a1 , a2 , a3 ) e b = (b1 , b2 , b3 ) é executado teclando o comando Cross[a, b]: In[30]:= (*--- Produto vetorial ---*) Clear[a1, a2, a3, b1, b2, b3] a = {a1, a2, a3}; b = {b1, b2, b3}; Cross[a, b] Out[33]:= {-a3 b2 + a2 b3, a3 b1 + a1 b3, -a2 b1 + a1 b2}
√ ¢ ¡ ¡ ¢ O produto vetorial de 3, 15 , 7 e π, 4, 35 : In[34]:= (*--- Produto vetorial ---*) a = {3, 1/5, Sqrt[7]}; b = {Pi, 4, 3/5}; Cross[a, b] √ √ Out[35]:= {3/25 − 4 7, −9/5 + 7π, 12 − π/5}
√ ¢ ¡ ¡ ¢ O produto vetorial de 3.0, 15 , 7 e π, 4, 35 : In[37]:= (*--- Produto vetorial ---*) a = {3.0, 1/5, Sqrt[7]}; b = {Pi, 4, 3/5}; Cross[a, b]
32
CAPÍTULO 2. CÁLCULO VETORIAL Out[39]:={-10.463, 6.51187, 11.3717}
O Mathematica trata números inteiros e números decimais (ponto flutuante) de forma diferente. Expressões com números inteiros são tratadas simbolicamente, enquanto que os números decimais são representados por expressões numéricas aproximadas. Os dois últimos resultados servem de ilustração deste fato. Em In[37], as componentes dos vetores a = {3, 1/5, Sqrt[7]} e b = {Pi, 4, 3/5} são todas do tipo simbólico e as componentes do vetor do resultado Out[36] também são do tipo simbólico. Por outro lado, em In[37], a primeira componente do vetor a = {3.0, 1/5, Sqrt[7]} é do tipo ponto flutuante e portanto o resultado Out[39] se apresenta numericamente. A regra é simples. Se um ou mais dos números de uma dada expressão for do tipo decimal (ponto flutuante), os demais números do tipo simbólico serão automaticamente transformados em números decimais. Até o momento, nos restringimos aos vetores tridimensionais (os vetores uni e bidimensionais são casos particulares dos tridimensionais). É perfeitamente possível generalizar o conceito de vetores geométricos. Faremos isso no oitavo capítulo. Veremos, por exemplo, que se pode construir vetores com n componentes. São os chamados vetores do Rn . Pode-se, também, a partir dos conjuntos R2 e R3 construir outras classes de vetores. É o caso, por exemplo, do conjunto de pares do tipo ((x, y) , z), sendo a primeira componente um par de números reais e a segunda componente um número real. Esse conjunto é simbolizado por R2 × R e é conhecido como o produto cartesiano de R2 por R. É importante notar que R2 × R e R3 são conjunto distintos. Analogamente, pode-se construir o conjunto R3 × R formado de pares do tipo ((x, y, z) , t) . Este conjunto é importantíssimo em eletromagnetismo. Não confundir os conjuntos R3 × R e R4 . O segundo representa um espaço tetradimensional e o primeiro não10 . Um vetor também pode ser construído com números complexos em vez de números reais. Todas as operações acima definidas para vetores reais são naturalmente estendidas para vetores com entradas complexas, com exceção de o produto escalar, que no caso complexo é o produto do primeiro vetor pelo conjugado do segundo, resultando num número real. O produto escalar é sempre um número real. O conjunto de vetores complexos tridimensionais 10 O espaço R4 é fundamental em eletromagnetismo avançado. Enquanto que, no eletromagnetismo mais básico (como o deste livro) o espaço R3 × R é o que normalmente se usa. A razão é que no eletromagnetismo avançado, também conhecido como eletrodinâmica, não se distingue fisicamente a componente tempo (na verdade, tempo vezes a velocidade da luz) das três componentes espaciais, constituindo assim o chamado espaço-tempo. No eletromagnetismo elementar, tempo e espaço são tratados separadamente.
2.3. INTEGRAIS DE LINHA, DE SUPERFÍCIE E DE VOLUME
33
é simbolizado por C3 . De posse do conceito de vetores, vamos retornar ao nosso ponto de partida e esclarecer o que significa campo escalar e campo vetorial. No primeiro capítulo, as equações de Maxwell foram apresentadas em termo de campo escalar (densidade de carga, condutividade, permissividade elétrica e permeabilidade magnética) e campos vetoriais (campo elétrico, campo magnético, densidade de fluxo elétrico, densidade de fluxo magnético, densidade de corrente). Nunca é demais lembrar que os conceitos de campo escalar e campo vetorial são vitais em eletromagnetismo. Tudo que será visto daqui para frente dependerá direta ou indiretamente desses dois tipos de campo. Dito isto, vamos às definições. Um campo escalar ψ é uma função de Ω ⊂ R3 em R. Isto é, a cada ponto (vetor) de uma região Ω ⊂ R3 associa-se um número (único) real. Um exemplo de campo escalar é a densidade ρ de carga elétrica de uma região do espaço tridimensional. Um campo vetorial f é uma função de Ω ⊂ R3 em R3 . Isto significa que a cada ponto de uma região Ω ⊂ R3 associa-se um vetor (único) de R3 . Exemplos de campos vetoriais são o campo elétrico E e o campo magnético H, definidos numa região Ω do espaço tridimensional. Campo elétrico e campo magnético podem ser complexos. Neste caso, eles são funções de Ω ⊂ R3 em C3 . Quando se deseja enfatizar que os campos elétrico e magnético variam com o tempo é apropriado usar funções de Ω × I ⊂ R3 × R em R3 ou em C3 . A cada ponto do espaço tridimensional associa-se um vetor que varia também no tempo (ou na freqüência). No texto, campo escalar e campo vetorial são simbolizados, indistintamente, por letras maiúsculas e minúsculas. No caso de campo vetorial a letra é sempre em negrito, no caso do campo escalar a letra é do tipo normal.
2.3
Integrais de Linha, de Superfície e de Volume
A motivação física de integral de linha vem da mecânica. Mais especificamente, do conceito de trabalho realizado por uma força ao deslocar um corpo ao longo de um percurso no espaço tridimensional. Por sua vez, a idealização da integral de superfície está relacionada ao conceito de fluxo de um fluído através de uma superfície contida no espaço tridimensional. Integrais de volume associam-se a campos escalares. Em eletromagnetismo, integrais de linha e de superfície não correspondem exatamente a trabalho e a fluxo, no mesmo sentido da mecânica. Mesmo assim, a visão mecanicista destas integrais é muito útil e facilita entender
34
CAPÍTULO 2. CÁLCULO VETORIAL
os fenômenos eletromagnéticos. Grosso modo, ela está por trás das idéias seminais de linhas de força e de fluxo de Faraday, que tanto influenciaram Maxwell.
2.3.1
Integral de linha de um campo vetorial
Em mecânica, quando um corpo é deslocado sob a ação de uma força, se diz que a força ou o agente que exerceu a força realizou trabalho. O leitor já deve ter visto, no curso elementar de Física, que se sob a ação de uma força f constante (em módulo, direção e sentido), um corpo experimenta um deslocamento d, no mesmo sentido dessa força, o trabalho w realizado por f é dado por
w = f · d. Quando a direção do vetor que representa a força f forma um ângulo θ com a direção do deslocamento d, a força que efetivamente contribui para deslocar o corpo é a componente tangencial ft de f ao longo da direção de d, ou seja, tangente à direção do deslocamento, Figura 2.5.
f d Figura 2.5: Deslocamento d de um corpo sob a ação de uma força f .
Se o deslocamento não se faz em linha reta, mas ao longo de um percurso curvilíneo, o trabalho é obtido substituindo o percurso por uma linha poligonal constituída de trechos lineares arbitrariamente pequenos. A linha poligonal é construída unindo-se pontos da curva, dois a dois seqüencialmente, como ilustra a Figura 2.7. A seguir, faremos essas idéias heurísticas um pouco mais precisas do ponto de vista matemático.
2.3. INTEGRAIS DE LINHA, DE SUPERFÍCIE E DE VOLUME ^
z ^
t
p2
35
z
t
^
t
p1 x
y
y
(a)
(b)
x
Figura 2.6: (a) Gráfico de uma curva simples e suave, (b) gráfico de uma curva não-simples. ^
t
z ^
t
p2 ln (xn, yn, zn)
p1
^
t
y
x Figura 2.7: Aproximação de uma curva suave por um caminho poligonal. Uma curva é uma aplicação11 α(t) = (x (t) , y (t) , z (t)) definida num intervalo da reta, t0 ≤ t ≤ t1 e tomado valores em R3 . Uma curva simples é aquela cujo gráfico12 não se intercepta em ponto algum, como o da Figura 2.6a. Caso contrário, a curva é dita não-simples, Figura 2.6b. Uma curva simples é chamada suave quando as funções componentes x (t) , y (t) e z (t) são diferenciáveis no intervalo [t0 , t1 ]. Isso significa que em cada ponto onde a curva é diferenciável existe um vetor ˆ t tangente, como ilustrado na Figura 2.6a. A variável independente t é comumente chamada de parâmetro e a função α(t) é denominada curva parametrizada pelo parâmetro t. Uma mesma curva pode adimitir várias parametrizações, ([11], [50]). Uma curva 11
A palavra aplicação é sinônimo de função, mapeamento entre dois conjuntos. O gráfico de uma curva é o traço de sua imagem em R3 . Não confundir uma curva com seu gráfico. A curva é uma função e o gráfico é simplesmente a sua representação geométrica no espaço. 12
36
CAPÍTULO 2. CÁLCULO VETORIAL
orientada é uma curva onde se especifica um sentido de percurso. A orientação da curva é dita positiva quando coincide com a do intervalo [t0 , t1 ], caso contrário é dita negativa13 . Um caminho C é a união de uma ou mais curvas suaves e orientadas. Um caminho pode deixar de ser suave nos pontos de junção de duas curvas contíguas. Em outras palavras, um caminho é uma função suave por partes. De acordo com a Figura 2.7, o trabalho em cada um dos trechos lineares da poligonal que aproxima o percurso suave é igual ao produto da componente tangencial ft da força f , pelo comprimento do elemento ∆ln . Somando-se a contribuição de todos os segmentos da poligonal, tem-se w'
N X
ft (xn , yn , zn ) ∆ln .
n=1
Considerando-se o número N de segmentos da poligonal um inteiro arbitrariamente grande e fazendo o valor máximo de ∆ln suficientemente pequeno, podemos escrever w=
lim
N →∞ max ∆ln →0
N X
ft (xn , yn , zn ) ∆ln =
Z
ft (x, y, z) dl,
C
n=1
sendo o caminho C o limite da poligonal. Ademais, quando o valor máximo t de ∆ln aproxima-se de zero, a componente tangencial ft tende para f · ˆ e por conseqüência podemos reescrever a integral do trabalho, da seguinte maneira, Z w= f (x, y, z) · ˆ tdl. (2.8) C
Como foi dito antes, usamos o conceito de trabalho apenas como motivação para especificar integrais do tipo (2.8). Integrais desse tipo são denominadas de integrais de linha de um campo vetorial f ao longo de um caminho C, independentemente do significado físico do campo vetorial. Integrais de linha são muito comuns em matemática, física, engenharia e geofísica. Elas são fundamentais em eletromagnetismo. Mais do que isto, elas formam um dos pilares mestres do eletromagnetismo. Dados o caminho C e o campo vetorial f , contínuo em C, como proceder para calcular a integral (2.8)? Para responder a essa questão, é preciso, 13 A orientação do intervalo [t0 , t1 ] é dita positiva quando se dá de t0 para t1 , e é dita negativa quando se dá no sentido contrário.
2.3. INTEGRAIS DE LINHA, DE SUPERFÍCIE E DE VOLUME
37
z l l l+ l
t
r r
^ r+ r
y
x Figura 2.8: Visualização dos incrementos ∆r e ∆l e do vetor tangente unitário b t.
primeiro, determinar o vetor tangente unitário ˆ t e efetuar o produto interno f ·ˆ t. É exatamente isto o que faremos agora. Observando a Figura 2.8, que mostra um pequeno segmento do gráfico de um curva, podemos escrever ∆x ∆y ∆z ˆ ∆r = î+ ˆj + k, ∆l ∆l ∆l ∆l
(2.9)
em que ∆l representa o incremento do comprimento de arco que liga dois pontos quaisquer do gráfico. Substituindo ∆x, ∆y e ∆z por ∆x = x (l + ∆l) − x (l) , ∆y = y (l + ∆l) − y (l) , ∆z = z (l + ∆l) − z (l) ,
e fazendo ∆l tender para zero, verifica-se facilmente que ∆r/∆l em (2.9) tem como limite o vetor tangente unitário. Mais precisamente, dx dy dz ˆ ˆ t= î + ˆj + k. dl dl dl
(2.10)
Substituindo esta expressão de ˆ t em (2.8), resulta ∙ ¸ Z dx dy dz ˆ î + ˆj + k f (x, y, z) · dl. dl dl dl C Finalmente, reescrevendo o campo vetorial f em termos de suas funções ˆ e sabendo-se que dx, dy componentes fx (x, y, z)î + fy (x, y, z)ˆj + fz (x, y, z) k
38
CAPÍTULO 2. CÁLCULO VETORIAL
dy e dz são equivalentes aos diferenciais dx dl dl, dl dl e reduz a Z fx dx + fy dy + fz dz.
dz dl dl,
a integral acima se
(2.11)
C
Esta é a fórmula que se usa no cálculo de integrais de linha. Na verdade, ela ainda precisa passar por uma ligeira transformação, antes de ser efetivamente utilizada nos cálculos. O segredo é empregar a parametrização t, do caminho, para transformá-la em uma integral ordinária no intervalo dy dz t0 < t < t1 . Consegue-se isto, fazendo dx = dx dt dt, dy = dt dt e dz = dt dt. Com efeito, podemos escrever Integral de linha :=
Z
t1
t01
¶ µ dx dy dz + fy (t) + fz (t) dt. fx (t) dt dt dt
(2.12)
O sinal da integral é positivo se a orientação do caminho for idêntica a do sistema de coordenadas, caso contrário, o sinal será negativo14 . A não ser em casos muito simples, o cálculo de integrais de linha por meio da integral.(2.12) é demasiadamente laborioso e cansativo. É precisamente aqui que o Mathematica faz uma grande diferença. Ele transforma cálculos trabalhosos, enfadonhos e desestimulantes em uma emocionante e prazerosa ”viagem”. Na linguagem do Mathematica, a integral (2.12) é traduzida ipsis litteris na função 15 integralDeLinha[x, y, z, t, fx, fy, fz, t0, t1] a seguir, em que x, y, z são as coordenadas de um ponto arbitrário na curva; t é o parâmetro de parametrização; fx, fy, fz são as componente do campo vetorial f (x, y, z) e t0 e t1 representam os extremos do intervalo de definição do parâmetro t.
14
Em muitos livros de cálculo, a integral de linha (2.8) de um campo vetorial é definida intuitivamente a partir do conceito de trabalho em mecânica, exatamente como foi feito aqui. Com esta difinição, a fórmula computacional (2.12) é obtida de modo natural. No entanto, nos livros mais avançados, especialmente os de geometria diferencial, a definição é dada de trás para frente. Em outras palavras, a integral de linha de um campo vetorial é definida axiomaticamente pela expressão (2.11) e a interpretação física (2.8) vem em segundo plano, como um mero detalhe. Mais a frente, veremos por quê é feito assim. 15 Também chamada de procedimente.
2.3. INTEGRAIS DE LINHA, DE SUPERFÍCIE E DE VOLUME
39
In[1]:= (*--- integralDeLinha[ ] calcula integrais de linha ---*) integralDeLinha[x_, y_, z_, t_, fx_, fy_, fz_, t0_, t1_]:= Module[{ }, Integrate[fx D[x, t] + fy D[y, t] + fz D[z, t], {t, t0, t1}]
Assim, para se calcular a integral de linha é suficiente fazer a parametrização do caminho e acionar a procedimento IntegralDeLinha[...]16 , e pronto! Aqueles que já tiveram oportunidade de calcular integrais de linha pelos métodos tradicionais, ficarão surpresos e gratificados com a simplicidade do Mathematica em encarar este tipo de cálculo. Sem exageiro, podemos dizer que o método convencional de cálculo de integrais de linha é coisa do passado, tais como a régua de cálculo e o cartão perfurado Holleritrh17 . Vejamos, agora, alguns exemplos interessantes. 2
y 0 -2
6
z 4 2 0 -2
-1
0 x
1 2
Figura 2.9: Caminho helicoidal no espaço tridimensional.
Exemplo 2.2: Dados o campo vetorial f = 6xyxî+(2y + xz)ˆj+(xy − ˆ e o caminho helicoidal parametrizado por α(t) = (2 sin (t) , 3 cos (t), 4z 2 )k t/3) em que 0 ≤ t ≤ 21, calcular a integral de linha. 16
Os tês pontos representam sibolicamente os argumentos do procedimento. Tenho certeza que a maioria dos leitores nunca viram uma régua de cálculo e, nem tão pouco, um cartão perfurado. Eu ainda guardo, saudosamente, a minha régua de cálculo, que me foi muito útil na década de sessenta do século passado. Guardo também alguns cartões perfurados, dos milhares que usei no início da década de setenta. 17
40
CAPÍTULO 2. CÁLCULO VETORIAL
Primeiro, vamos contruir o gráfico do caminho helicoidal da Figura 2.9. Para isto basta digitar os comandos: In[2]:= (*--- Figura 2.9, caminho helicoidal ---*) ParametricPlot3D[{2 Sin[t], 3 Cos[t], t/3}, {t, 0, 21}, AxisLabel -> {"x", "y", "z"}];
Antes de se usar o Mathematica para computar a integral de linha, vejamos, a título de curiosidade, como seria feito o cálculo pelo método tradicional apresentado nos livros de cálculo. O primeiro passo seria substituir as coordenadas parametrizadas, x = 2 sin (t) , y = 3 cos (t) e z = t/3, ¡ nas ex¢ pressões das três componentes, fx = 6xyz, fy = (2y + xz) e fz = xy − 4z 2 do campo f . Isto corresponde a mudança das variáveis x, y, z pela variável t. Em seguida seriam calculadas as derivadas, em relação ao parâmetro t, de cada coordenada da parametrização. Por fim, as coordenadas do campo, em função do parâmetro t, e as derivadas seriam substituídas na fórmula (2.12) da integral de linha. Seguindo esses passos e após algumas simples manipulações algébricas, chegaríamos à seguinte integral ordinária, Z
21
(12 sin (t) cos2 (t) t + (6 cos (t) +
0
4 (6 sin (t) cos (t) − t2 )dt. 9
2 sin (t) t + 3 (2.13)
Cada termo dessa integral pode ser facilmente calculado pelos métodos tradicionais de resolução de integrais de uma variável, ([3], [25]). Resolvidas as integrais, chega-se ao valor −660.669 correspondenta à integral de linha em questão18 . Como se vê, esse processo manual é um tanto quanto trabalhoso e chato. Com integrais mais complicadas, o trabalho pode se tornar insuportável. Talvez seja por isso, que a maioria dos livros de cálculos se restringem a exemplos simples, do tipo acadêmico, sem nenhum interesse prático. Com o auxílio do programa Mathematica, o panorama é outro. De fato, o cálculo de integrais de linha não passa de alguns simples comandos na tela do monitor do computador. Com efeito, é preciso apenas digitar as expressões do campo vetorial e da curva parametrizada e executar a função integralDeLinha[...]. Simples, não é? Portanto, 18 Nesse livro usamos o ponto decimal no lugar da vírgula para manter a compatibilidade de notação com o Mathematica.
2.3. INTEGRAIS DE LINHA, DE SUPERFÍCIE E DE VOLUME
41
In[3]:= (*--- Integral de linha ao longo do caminho helicoidal da Figura 2.9 ---*) Clear[x, y, z, t] {fx, fy, fz} = {6 x y z, 2 y + x z, x y - 4 z^2}; {x, y, z} = {2 Sin[t], 3 Cos[t], t/3}; {integralDeLinha[x, y, z, t, fx, fy, fz, 0, 21]
Instantaneamente, o computador nos fornece o seguinte resultado da integral de linha, em notação simbólica, In[6]:= −8185/12 − 126 Cos[21] + 17 Cos[42]/4 − 42 Cos[63] + 6 Sin[21]+ 21 Sin[42]/2 + 2 Sin[63]/3
Para se obter o valor numérico desta expressão simbólica basta evocar o seguinte comando19 : In[7]:= (*--- Valor numérico do resultado do exemplo anterior ---*) N[%] Out[7]:= -660.669
O sinal negativo deve-se ao fato do caminho ter sido percorrido no sentido horário, e portanto, contrário ao sentido anti-horário do sistema xyz de coordenadas. Exemplo 2.3: Com o campo mesmo vetorial f = 6xyxî+(2y + ˆ e o caminho helicoidal amortecido parametrizado por xz)ˆj+(xy − 4z 2 )k α(t) = (t2 /50 sin (t) , t2 /50 cos (t), t) em que 0 ≤ t ≤ 8π, calcular a integral de linha neste percurso. Primeiro, vamos construir o gráfico do caminho helicoidal amortecido da Figura 2.10. Para isto basta digitar os comandos: In[8]:= (*--- Figura 2.10, caminho helicoidal amortecido ---*) ParametricPlot3D[{t^2/50 Sin[t], t^2/50 Cos[t], t}, {t, 0, 8 Pi}, AxisLabel -> {"x", "y", "z"}]; 19 O sinal % significa o resultado anterior. O comando N[%] calcula o valor numérico do resultado anterior.
42
CAPÍTULO 2. CÁLCULO VETORIAL
y
10 5
0 -5 -10
20 z 10
0 -10 -5 x
0 5
Figura 2.10: Caminho helicoidal amortecido.
Agora, vejamos o cálculo da integral de linha ao longo do caminho helicoidal amortecido da Figura 2.10. Aplicando como no exemplo anterior a função integralDeLinha[...] temos In[9]:= (*--- Integral de linha ao longo do caminho helicoidal amortecido da Figura 2.10 ---*) Clear[x, y, z, t] {fx, fy, fz} = {6 x y z, 2 y + x z, x y - 4 z^2}; {x, y, z} = {t^2/50 Sin[t], t^2/50 Cos[t], t}; {integralDeLinha[x, y, 6z, t, fx, fy, fz, 0, 8 Pi] Out[12]:= -2 π (-393680 - 6075 π + 43620960 π 2 - 907200 π 3 - 1349224 π 4 + -5529600 π 5 + 21233664 π 6 )/1265625 In[13]:= (*--- Valor numérico do resultado do exemplo anterior ---*) N[%] Out[13]:= -124451.
Foi dito acima que uma mesma curva pode admitir mais de uma parametrização. Um tipo de parametrização muito comum, principalmente nos livros de geometria diferencial, é a parametrização por comprimento de arco, conhecida por retificação da curva. Dada um curva α(t) = (x(t), y(t), z(t))
2.3. INTEGRAIS DE LINHA, DE SUPERFÍCIE E DE VOLUME em que t0 6 t 6 t, o seu comprimento s é expresso por: ° Z t1 q Z t1 ° ° dα(t) ° ° ° dt = (x0 )2 + (y 0 )2 + (z 0 )2 dt. s= ° dt ° t0 t0
43
(2.14)
O próximo exemplo ilustra como o valor da integral de linha independe da parametrização do caminho..
1 0.75 y 0.5 0.25 0 1
0.75 z 0.5 0.25 0 1 1.2 x
1.4
Figura 2.11: Gráfico da curva parametizada α (t) = (cosh t, sinh t, t) em que 0 6 t 6 1. Exemplo 2.4: Dados o campo vetorial f = 6xyxî + (2y + xz)ˆj + (xy − e a curva α(t) = (cosh t, sinh t, t) em que 0 ≤ t ≤ 1, vamos neste exemplo calcular a integral de linha com duas parametrizações diferentes: α(t) e α(s) em que s é o comprimento de arco. Para começar, vamos traçar o gráfico de α(t), ilustrado na Figura 2.11. Procedendo como o caso da hélice, vem: ˆ 4z 2 )k
In[14]:= (*--- Figura 2.10, curva alfa ---*) ParametricPlot3D[{Cosh[t], Sinh[t], t}, {t, 0, 1}, AxisLabel -> {"x", "y", "z"}];
Feito o gráfico, vamos, agora, computar a integral de linha com a primeira parametrização. Então:
44
CAPÍTULO 2. CÁLCULO VETORIAL In[15]:= (*--- Integral de linha ao longo da curva alfa(t) da Figura 2.11 ---*) Clear[x, y, z, t] {fx, fy, fz} = {6 x y z, 2 y + x z, x y - 4 z^2}; {x, y, z} = {Cosh[t], Sinh[t], t}; {integralDeLinha[x, y, z, t, fx, fy, fz, 0, 1] // Simplify Out[18]:= 1/24 (−73 + 36Cosh[1] + 15Cosh[2] − 4Cosh[3]− 36Sinh[1] + 6Sinh[2] + 12Sinh[3])
Agora vamos recalcular a mesma integral usando a parametrização pelo comprimento de arco. Para isso, é preciso, primeiro, determinar esta nova parametrização. Empregando-se (2.14) vem: Z tp √ Z t √ sinh2 τ + cosh2 τ + 1dτ = 2 cosh τ dτ = 2 sinh t, s= 0
0
2 2 onde se¡usou √ ¢a identidade cosh τ − sinh τ = 1. Dai, se conclui que t = arcsinh s/ 2 e por conseqüência, a parametrização pelo comprimento de arco é expressa assim: ³ ³ √ ´´ ³ √ ´´ ³ ³ ³ √ ´´ α(s) = cosh arcsinh s/ 2 , sinh arcsinh s/ 2 , arcsinh s/ 2 ,
√ em que 0 6 s 6 2 sinh (1). De posse desta nova parametrização, vamos ao cálculo da integral de linha: In[19]:= (*--- Integral de linha ao longo da curva alfa(s) da Figura 2.11 ---*) Clear[x, y, z, t] {fx, fy, fz} = {6 x y z, 2 y + x z, x y - 4 z^2}; {x, y, z} = {Cosh[ArcSinh[s/Sqrt[2]]], Sinh[ArcSinh[s/Sqrt[2]]]], ArcSinh[s/Sqrt[2]]}; integralDeLinha[x, y, z, t, fx, fy, fz, 0, Sqrt[2] Sinh[1]] // FullSimplify Out[22]:= (−16+ e (9 + e (72 − 146 e + 21 e3 + 8 e4 )))/(48 e3 )
Opa! Os resultados Out[18] e Out[22] parecem bem diferentes. Calma! Eles são absolutamente idênticos, pois a diferença entre ambos é zero. Com efeito,
2.3. INTEGRAIS DE LINHA, DE SUPERFÍCIE E DE VOLUME
45
In[23]:= (*--- Comparação dos resultados Out[12] e Out[16] ---*) Out[18] - Out[22] // Simplify {fx, fy, fz} = {6 x y z, 2 y + x z, x y - 4 z^2}; Out[23]:= 0
Exemplo 2.5: Uma das maneiras mais prática e elegante de construir uma curva em R3 é por meio da interseção de duas superfícies no espaço tridimensional. Neste terceiro exemplo, vamos construir uma curva denominada Viviani, formada pela interseção da esfera x2 + y 2 + z 2 = 4 com o cilindro (x − 1)2 + y 2 = 1 no primeiro quadrante, [14]. Em seguida 3 2 vamos calcular a integral √ de linha do campo vetorial {fx = 4x − 2yz , 2 3 fy = 7xy z, fz = yz / 7}, do ponto (2, 0, 0) ao ponto (0, 0, 2), ao longo da curva Viviani. Primeiro, é preciso parametrizar a curva Viviani. Isto é, devemos determinar α(t) = (x (t) , y (t) , z (t)) em relação a um certo parâmetro t, Como as coordenadas x (t) e y (t) da Viviani coincidem com as coordenadas x (t) e y (t) do cilindro, podemos simplesmente escrever x(t) = 1+cos t, y(t) = sin t; −π ≤ t ≤ π. Agora, para se obter a componente z (t) usa-se a equação da esfera intersectada pelo cilindro. Assim, p z = ± 4 − x2 − y 2 q = ± 4 − (1 + cos t)2 − sin2 t √ = ± 2 − 2 cos t = 2 sin (t/2) .
Logo, a parametrização da curva Viviani é expressa pela curva parametrizada, α(t) = (1 + cos t, sin t, 2 sin (t/2)) em que −π ≤ t ≤ π. Antes de calcular a integral de linha ao longo da Viviani, seria interessante dar uma olhada no gráfico da curva. Para isso, vamos traçá-lo em duas etapas. Na primeira, serão desenhados apenas o semicírculo da base do cilindro e os arcos que formam o primeiro oitante da esfera, como ilustra a Figura 2.12. Assim, In[26]:= (*--- Figura 2.12, traço do cilindro e do primeiro oitante da esfera ---*) semicirculo = {1 + Cos[t], Sin[t], 0}; oitante = {{0, 2 Cos[t/2], 2 Sin[t/2]}, {2 Cos[t/2], 0, 2 Sin[t/2]},
46
CAPÍTULO 2. CÁLCULO VETORIAL {2 Cos[t/2], 2 Sin[t/2], 0}}; ParametricPlot3D[Evaluate[Join[{semicirculo, oitante]], {t, 0, Pi}, AxisLabel -> {"x", "y", "z"}, ViewPoint -> {6, 4, 1}];
2
1.5
x 1
0.5 0
2
1.5
z 1
0.5
0 0
0.5
1 y
1.5
2
Figura 2.12: Traços do cilindro e do oitante da esfera no plano xy no primeiro oitante. Agora, vamos completar a Figura 2.12, incluindo também a curva Viviani, resultante da interseção do oitante da esfera com o cilindro, este último representado apenas pelo o seu traço no plano xy: In[28]:= (*--- Figura 2.13, gráfico da curva Viviani ---*) semicirculo = {1 + Cos[t], Sin[t], 0}; oitante = {{0, 2 Cos[t/2], 2 Sin[t/2]}, {2 Cos[t/2], 0, 2 Sin[t/2]}, {2 Cos[t/2], 2 Sin[t/2], 0}}; viviane = {1 + Cos[t], Sin[t], 2 Sin[t/2]}}; ParametricPlot3D[Evaluate[Join[{semicirculo}, oitante,{viviane}]], {t, 0, Pi}, AxisLabel -> {"x", "y", "z"}, ViewPoint -> {6, 4, 1}];
Obtém-se, assim, o gráfico da curva Viviani, majestosamente exibida na Figura 2.13.
2.3. INTEGRAIS DE LINHA, DE SUPERFÍCIE E DE VOLUME
2
1.5
x 1
0.5
47
0
2
1.5
z 1
0.5
0 0
0.5
1 y
1.5
2
Figura 2.13: A interseção de um cilindro com o oitante da esfera forma a curva Viviani. Voltando ao cálculo da integral de linha e procedendo como no exemplo anterior, podemos escrever20 : In[33]:= (*--- Integral de linha ao longo da curva Viviani ---*) Clear[x, y, z, t] {fx, fy, fz} = {4 x^3 - 2 y z^2, 7 x y^2 z, y z^3/Sqrt[7]}; {x, y, z} = {1 + Cos[t], Sin[t], 2 Sin[t/2]}; integralDeLinha[x, y, z, t, fx, fy, fz, 0, Pi] √ Out[36]:= −656/45 + 2π + π/ 7
O resultado é exato. Eis aqui um valor aproximado com seis casas decimais: In[37]:= (*--- Valor numérico do resultado do exemplo anterior ---*) N[%] Out[37]:= -7.10718
Exemplo 2.6: Neste quarto exemplo vamos calcular a integral de linha do campo vetorial {fx = 3x2 − 6yz, fy = 2y + 3xz, fz = 1 − 4xyz 2 }, do 20
É claro que para se fazer o cálculo da integral de linha não haveria necessidade de traçar o gráfico do caminho. Fizemos isso apenas para ilustrar o gráfico de uma curva formada pela interseção de duas superfícies de R3 . De qualquer modo, uma boa figura é uma grande ajuda na solução de qualquer problema em matemática [59]. Diz o ditado popular que uma figura vale por mil palavras.
48
CAPÍTULO 2. CÁLCULO VETORIAL
ponto (0, 0, 0) ao ponto (1, 1, 1) ao longo de quatro caminhos distintos, assim discriminados: • α(t) = (x(t) = t, y (t) = t2 , z (t) = t3 ) em que 0 ≤ t ≤ 1, • união dos percursos: {de (0, 0, 0) a (1, 0, 0) no eixo x}, {de (1, 0, 0) a (1, 1, 0) no eixo y} e {de (1, 1, 0) a (1, 1, 1) no eixo z}, • união dos percursos: {de (0, 0, 0) a (1, 0, 0) no eixo x}, {de (1, 0, 0) a (1, 0, 1) no eixo z} e {de (1, 0, 1) a (1, 1, 1) no eixo y}, • α(t) = (x(t) = t, y(t) = t, z(t) = t) em que 0 ≤ t ≤ 1, diagonal de (0, 0, 0) a (1, 1, 1) .
Para facilitar a visualização espacial dos quatro caminhos decidimos mostrar os gráficos em duas figuras separadas. Os gráficos do primeiro e segundo caminhos estão representados na Figura 2.14 e os dos dois últimos, na Figura 2.15. Vejamos, então, os gráficos dos dois primeiros caminhos: 1 y 0.75 0.5 0.25 0 1 0.75 z 0.5 0.25 0 0 0.25 0.5 x
0.75 1
Figura 2.14: A curva suave é o caminho 1 e a curva linear por partes é o caminho 2.
In[38]:= (*--- Figura 2.14, gráfico dos caminhos 1 e 2 ---*) Clear[t] caminho1 = {t, t^2, t^3};
2.3. INTEGRAIS DE LINHA, DE SUPERFÍCIE E DE VOLUME
49
caminho2 = {{t, 0, 0}, {1, t, 0},{1, 1, t}}; ParametricPlot3D[Evaluate[Join[{caminho1}, caminho2]], {t, 0, 1}, AxisLabel -> {"x", "y", "z"}];
De forma análoga, podemos traçar os gráficos dos dois outros caminhos: In[42]:= (*--- Figura 2.15, gráfico dos caminhos 3 e 4 ---*) Clear[t] caminho3 = {{t, 0, 0}, {1, 0, t}, {1, t, 1}]; caminho4 = {t, t, t}; ParametricPlot3D[Evaluate[Join[caminho3, {caminho4}]], {t, 0, 1}, AxisLabel -> {"x", "y", "z"}];
1 y 0.75 0.5 0.25 0 1 0.75 z 0.5 0.25 0 0 0.25 0.5 x
0.75 1
Figura 2.15: A curva linear por partes é o caminho 3 e a diagonal é o caminho 4. Feitos os gráficos, vamos agora calcular as integrais de linha em cada um dos quatro caminhos:
• Integral no primeiro caminho: α(t) = (x (t) = t, y (t) = t2 , z (t) = t3 ); 0 ≤ t ≤ 1:
50
CAPÍTULO 2. CÁLCULO VETORIAL In[46]:= (*--- Integral de linha ao longo do caminho 1 ---*) Clear[x, y, z, t] {fx, fy, fz} = {3 x^2 - 6 y z, 2 y + 3 x z, 1 - 4 x y z^2}; {x, y, z} = {t, t^2, t^3}; integralDeLinha[x, y, z, t, fx, fy, fz, 0, 1] Out[49]:= 2
• Integral no segundo caminho, constituído dos trechos: (de (0, 0, 0) a (1, 0, 0) no eixo x) união (de (1, 0, 0) a (1, 1, 0) no eixo y) união (de (1, 1, 0) a (1, 1, 1) no eixo z):
In[50]:= (*--- Integral de linha ao longo do caminho 2 ---*) Clear[x, y, z, t] {fx, fy, fz} = {3 x^2 - 6 y z, 2 y + 3 x z, 1 - 4 x y z^2}; {x, y, z} = {t, 0, 0}; trecho1 = integralDeLinha[x, y, z, t, fx, fy, fz, 0, 1] {x, y, z} = {1, t, 0}; trecho2 = integralDeLinha[x, y, z, t, fx, fy, fz, 0, 1] {x, y, z} = {1, 1, t}; trecho3 = integralDeLinha[x, y, z, t, fx, fy, fz, 0, 1] trecho1 + trecho2 + trech3 Out[53]:= 1 Out[55]:= 1 Out[57]:= -1/3 Out[58]:= 5/3
Os resultados parciais Out[53], Out[55] e Out[57] correspondem, individualmente, a cada um dos trechos do caminho 2. O resultado final, Out[58], é obtido totalizando os três resultados parciais. • Cálculo da integral no terceiro caminho, constituídos dos trechos: {de (0, 0, 0) a (1, 0, 0) no eixo x} união {de (1, 0, 0) a (1, 0, 1) no eixo z} união {de (1, 0, 1) a (1, 1, 1) no eixo y}:
In[59]:= (*--- Integral de linha ao longo do caminho 3 ---*) Clear[x, y, z, t] {fx, fy, fz} = {3 x^2 - 6 y z, 2 y + 3 x z, 1 - 4 x y z^2};
2.3. INTEGRAIS DE LINHA, DE SUPERFÍCIE E DE VOLUME {x, y, z} trecho1 = {x, y, z} trecho2 = {x, y, z} trecho3 = trecho1 +
51
= {t, 0, 0}; integralDeLinha[x, y, z, t, fx, fy, fz, 0, 1] = {1, 0, t}; integralDeLinha[x, y, z, t, fx, fy, fz, 0, 1] = {1, t, 1}; integralDeLinha[x, y, z, t, fx, fy, fz, 0, 1] trecho2 + trech3
Out[62]:= 1 Out[64]:= 1 Out[66]:= 4 Out[67]:= 6
• E por fim, o cálculo da integral no quarto caminho: α(t) = (x (t) = t, y (t) = t, z (t) = t) em que 0 ≤ t ≤ 1: In[68]:= (*--- Integral de linha ao longo do caminho 4 ---*) Clear[x, y, z, t] {fx, fy, fz} = {3 x^2 - 6 y z, 2 y + 3 x z, 1 - 4 x y z^2}; {x, y, z} = {t, t, t}; integralDeLinha[x, y, z, t, fx, fy, fz, 0, 1] Out[71]:= 6/5
Os resultados das integrais de linha nos quatro caminhos são, respectivamente, 2, 5/3, 6 e 6/5. Bem diferente um do outro, não é? Este é um resultado razoável, pois é de se esperar que o valor da integral de linha de um campo vetorial qualquer seja efetivamente dependente da geometria do caminho. Será que é sempre assim? Ou existem campos vetoriais especiais em que o valor da integral de linha independe do caminho? A resposta é afirmativa. De fato, existe uma classe de espaços vetoriais em que isto realmente acontece. Vejamos, então, um exemplo: Exemplo 2.7: Com os mesmos quatro caminhos do exemplo anterior, vamos considerar, agora, um outro campo vetorial, expresso por fx = 5y 3 z+ 4x cos y, fy = 15xy2 z − 2x2 sin y, fz = 5xy3 − cos z/3 e recalcular as quatro integrais de linha. • Integral no primeiro caminho, α(t) = (x (t) = t, y (t) = t2 , z (t) = t3 ) em que 0 ≤ t ≤ 1 :
52
CAPÍTULO 2. CÁLCULO VETORIAL In[72]:= (*--- Integral de linha ao longo do caminho 1 ---*)
21
Out[75]:= 5 + 2 Cos[1] − Sin[1]/3
• Integral no segundo caminho constituído dos trechos: (de (0, 0, 0) a (1, 0, 0) no eixo x) união (de (1, 0, 0) a (1, 1, 0) no eixo y) união (de (1, 1, 0) a (1, 1, 1) no eixo z):
In[76]:= (*--- Integral de linha ao longo do caminho 2 ---*) Out[76]:= 2 Out[81]:= −2(1 − Cos[1]) Out[82]:= 5 − Sin[1]/3 Out[84]:= 5 + 2 Cos[1] − Sin[1]/3
• Integral no terceiro caminho constituído dos trechos: {de (0, 0, 0) a (1, 0, 0) no eixo x} união {de (1, 0, 0) a (1, 0, 1) no eixo z} união {de (1, 0, 1) a (1, 1, 1) no eixo y}:
In[85]:= (*--- Integral de linha ao longo do caminho 3 ---*) Out[88]:= 2 Out[90]:=
−Sin[1]/3
Out[92]:= 3 + 2 Cos[1] Out[93]:= 5 + 2 Cos[1] − Sin[1]/3
• Finalmente, o cálculo da integral no quarto caminho, C(t) = (x (t) = t, y (t) = t, z (t) = t) em que 0 ≤ t ≤ 1: In[94]:= (*--- Integral de linha ao longo do caminho 4 ---*) Out[97]:= 5 + 2 Cos[1] − Sin[1]/3
O valor numérico correspondente a este resultado simbólico é: In[98]:= (*--- Valor numérico do resultado do exemplo anterior ---*) N[%] Out[98]:= 5.80011 21
O símbolo o livro.
indica que o restante do código se encontra no CD-Rom que acompanha
2.3. INTEGRAIS DE LINHA, DE SUPERFÍCIE E DE VOLUME
53
Observa-se que os valores das integrais de linha nos quatro caminhos são todos iguais22 a 5 + 2 cos(1) − sin(1)/3, ou aproximadamente 5.80011. Ao contrário do exemplo anterior, o valor da integral, agora, independe do caminho. Por quê? Bom, a resposta será dada logo em breve. O fato de integrais de linha de certos campos vetoriais não dependerem do caminho é de fundamental importância em eletromagnetismo. Dizer que a integral de linha de um campo vetorial não depende do caminho é equivalente a dizer que o valor da integral de linha ao redor de um caminho fechado é identicamente zero. Com efeito, basta ir e voltar por dois caminhos diferentes que ligam dois pontos quaisquer do espaço. Mais adiante, como já disse, veremos como identificar campos vetoriais que possuem essa propriedade importantíssima. Mas antes, vamos falar um pouco de nosso próximo assunto: integrais de superfície.
2.3.2
Integral de superfície de um campo vetorial
A motivação física da integral de superfície de um campo vetorial se prende ao conceito de fluxo de um fluido através de uma superfície no espaço tridimensional. Para se ter uma idéia mais concreta desta analogia, vamos idealizar a seguinte experiência. Suponhamos um fluido de densidade ρ escoando com velocidade uniforme v através de uma superfície S. Deseja-se saber qual a quantidade de fluido que atravessa uma determinada seção ∆S, da superfície, perpendicular à direção de escoamento do fluido. Sabe-se que uma certa quantidade de fluido num cilindro de comprimento v∆t e seção transversal ∆S atravessa a seção ∆S no intervalo de tempo ∆t. Observandose a Figura 2.16a, o volume desse cilindro é igual a v∆t∆S. Assim, o cilindro contém um total ρv∆t∆S de fluido. A vazão através de ∆S é igual a ρv∆S, ou seja, é a quantidade de fluido por unidade de tempo. No caso, mais interessante, em que a direção do escoamento do fluido é oblíqua à seção ∆S, a vazão passa a ser ρv∆S cos θ, sendo θ o ângulo entre o vetor velocidade v e o vetor unitário n ˆ , normal à ∆S, apontando para fora do cilindro, no mesmo sentido do escoamento do fluido, veja Figura 2.16b. ˆ, a expressão da vazão torna-se ρv · n ˆ ∆S. Como v cos θ é igual a v · n Suponhamos, agora, uma superfície suave S contida no espaço tridimensional onde escoa um determinado fluido como mostra a Figura 2.17a. Fazendo-se uma partição poligonal23 da superfície S, a vazão através de uma 22
Em português a abreviatura de seno é "sen", mas neste livro usaremos a abreviatura "sin"por questão de compatibilidade com o Mathematica. 23 Uma partição poligonal de uma superfície é uma subdivisão da superfície em pequenos retalhos poligonais contíguos, comumente do tipo triangular ou do tipo retangular.
54
CAPÍTULO 2. CÁLCULO VETORIAL v S
v
^ n
^ n
S
v t v t (a)
(b)
Figura 2.16: Fluxo através de uma seção ∆S: a) direção do fluxo normal à superfície, b) direção do fluxo oblíqua à superfície.
z
z S
^ n
S
(xn, yn, zn)
y x
^ n
y x
(a)
(b)
Figura 2.17: (a) Ilustração do escoamento de um fluido através de uma superfície suave. (b) Partição poligonal da superfície. das faces poligonais ∆sn é, conforme o argumento acima, aproximadamente n∆sn , sendo (xn , yn , zn ) o ponto no centro igual a ρ (xn , yn , zn ) v (xn , yn , zn )·ˆ ˆ o vetor unitário normal à face neste ponto, como ilustra a da face ∆sn e n Figura 2.17b. Somando-se as vazões em cada face, obtém-se a vazão total, através da superfície poligonal, denominada também de fluxo. Portanto,
fluxo através de S :=
N X
n=1
ρ (xn , yn , zn ) v (xn , yn , zn ) · n ˆ ∆sn .
Supondo o número N de faces um inteiro arbitrariamente grande e fazendo o valor máximo de ∆sn suficientemente pequeno, então, podemos
2.3. INTEGRAIS DE LINHA, DE SUPERFÍCIE E DE VOLUME
55
escrever, fluxo através de S
: = =
Z
lim
N →∞ max ∆sn →0
S
N X
n=1
ρ (xn , yn , zn ) v (xn , yn , zn ) · n ˆ∆sn
ρ (x, y, z) v (x, y, z) · n ˆds.
(2.15)
Se S for uma superfície fechada e o fluxo que sai for maior que o fluxo que entra na região limitada pela superfície, o valor da integral é considerado positivo. Caso contrário, o valor é negativo. Obviamente, se o fluxo que entra for contrabalançado pelo fluxo que sai, o valor da integral será zero. Se cognominarmos ρ (x, y, z) v (x, y, z) por f (x, y, z) na integral (2.15) podemos escrever Z Fluxo através de S := f ·n ˆds. (2.16) S
Foi dito acima que a integral de linha é um dos pilares mestres do eletromagnetismo. Um outro pilar mestre é a integral do tipo 2.16, denominada integral de superfície de um campo vetorial f . É conhecida, também, como fluxo de um campo vetorial f através de S, mesmo que f não represente qualquer escoamento de fluido, propriamente dito. O campo vetorial f (x, y, z) é normalmente denominado de densidade de fluxo. Intuitivamente, esta integral nos dá a idéia de escoamento de algo através de uma superfície, mesmo que não haja efetivamente deslocamento de matéria. Digamos que ela representa o fluxo de um escoamento de algo virtual, como, por exemplo, o da densidade de fluxo magnético B. No quarto capítulo teremos muito o que falar sobre isto. Uma vez esclarecido o significado físico da integral (2.16), nos resta desenvolver um procedimento prático para a computação de fluxos de campos vetoriais através de uma superfície S, orientada e suave por parte. Mas o que é uma superfície orientada e suave por parte? São aquelas em que faz sentido falar sobre traspassação de fluxos de um lado para outro. A seguir, faremos estas noções de orientação e suavidade de superfícies um pouco mais precisas do ponto de vista matemático. No primeiro capítulo já tocamos ligeiramente nesse assunto de superfície orientada. Lembre-se que uma superfície pode ser aberta ou fechada. Diz-se que uma superfície é aberta quando ela tem uma fronteira, caso contrário, ela é dita fechada. Uma superfície aberta é dita orientada quando possui dois lados. Existem superfícies abertas com apenas um lado. O exemplo
56
CAPÍTULO 2. CÁLCULO VETORIAL
Figura 2.18: A faixa de Moebius possui apenas uma face mais notório de uma superfície aberta não-orientada é a faixa de Moebius, ilustrada na Figura 2.18. Para traçar a faixa de Moebius usamos os seguintes comandos, [87]: In[1]:= (*--- Figura 2.18: Faixa de Moebius ---*) {”x”, ”y”, ”z” }, ViewPoint -> {-4, -1, 5},}, DisplayFunction -> Identity];
66
CAPÍTULO 2. CÁLCULO VETORIAL 0 0.5
1 0.75 0.5 z 0.25 0
1x
1 0.75 0.5 z 0.25 20
1.5 2 1 0.5
-1
-0.5
0 y
0.5
1
1.5 y
0
1
-0.5
x
0.5 -1 0
Figura 2.24: Superfície suave vista de dois ângulos diferentes. A face visível é o lado positivo da superfície. p1 = ParametricPlot3D[{u^2 + v^2, u^2 - v^2, u v}, {u, 0, 1}, {v, 0, 1}, AxesLabel -> {”x”, ”y”, ”z”}, ViewPoint -> {-2, -2, 2}, DisplayFunction -> Identity] Show[GraphicsArray[{p1,p2}, DisplayFunction -> $DisplayFunction];
Como no caso anterior, aplicando a função integralDeSuperficie[...] determina-se facilmente o fluxo. Logo: In[22]:= (*--- Cálculo da integral de superfície ---*) Clear[u, v] {fx, fy, fz}:= {1, 1, 1}; {x, y, z} = {u^2 + v^2, u^2 - v^2, u v}; integralDeSuperficie[x, y, z, v, u, fx, fy, fz, 0, 1, 0, 1] Out[25]:= −2/3
Exemplo 2.10:. Nos dois exemplos anteriores as superfícies foram do tipo aberta, agora vamos calcular o fluxo através de uma superfície fechada. ˆ o nosso obCom o campo vetorial f = −xz 2 î + x2 (z − y)ˆj − y (2x − yz) k, jetivo é determinar o fluxo através da superfície formada por uma esfera √ x2 + y 2 + z 2 = a2 secionada pelo plano x + y + (z − a 2/2) = 0. O plano interceptante forma é dada por √ um disco cuja parametrização √ ϕ1 (u, v) = (u cos v, u sin v, a 2/2), em que 0 ≤ u ≤ a 2/2 e 0 ≤ v ≤ 2π,
2.3. INTEGRAIS DE LINHA, DE SUPERFÍCIE E DE VOLUME
67
1 y/a 0.5 0 -0.5 -1 0.5 z/a 0 -0.5 -1 -1 -0.5 0 x/a
0.5 1
Figura 2.25: Superfície suave por partes formada por uma superfície esférica secionada por um plano horizontal. enquanto que a parametrização da esfera interceptada é dada por ϕ2 (u, v) = (a sin u cos v, a sin u sin v, a cos u), sendo π/4 ≤ u ≤ π e 0 ≤ v ≤ 2π 33 . De posse da parametrização das duas superfícies parciais, o traçado do gráfico, ilustrado na Figura 2.25, é imediato com o Mathematica. Com efeto, In[26]:= (*--- Figura 2.25:
Superfície da esfera secionada por
um plano horizontal ---*)
33 Neste livro, convencionamos os sistemas de coordenadas cilíndricas e esféricas de acordo com as seguintes figuras:
z
z ( , , z)
(r, , )
r
z
y x
y x
Naturalmente, outros símbolos também podem ser usados, como por exemplo (u, v, z) para as coordenadas cilíndricas e (r, u, v) para coordenadas esféricas.
68
CAPÍTULO 2. CÁLCULO VETORIAL
Tratando-se de uma superfície suave por partes, o fluxo total é composto pela soma dos fluxos em cada uma das partes suaves (a esfera interceptada e o disco interceptor) que formam a superfície. Logo, podemos escrever: In[30]:= (*--- Cálculo da integral de superfície ---*) Clear[x, y, z, u, v] {fx, fy, fz}:= {-x z^2, x^2 (z - y), -y (2 x-y z)}; {x, y, z} = {u Cos[v], u Sin[v], Sqrt[2]/2}; fluxoDisco = integralDeSuperficie[x, y, z, v, u, fx, fy, fz, 0, a Sqrt[2]/2, 0, 2Pi]; {x, y, z} = {a Sin[u] Cos[v], a Sin[u] Sin[v], a Cos[u]}; fluxoEsfera = integralDeSuperficie[x, y, z, v, u, fx, fy, fz, Pi/4, Pi, 0, 2Pi]; fluxoEsfera = integralDeSuperficie[x, y, z, v, u, fx, fy, fz, fluxoSuperficie = fluxoDisco + fluxoEsfera
¡ √ ¢ 16 2
Out[33]:= a5 π/
√ 2) ¡ √ ¢ 2 5 Out[36]:= −2a π/15 −7a π/ 60 2 Out[35]:= −2a5 π/15 − 43a5 π/(240
Os resultados parciais Out[33] e Out[35] correspondem aos fluxos através do disco e da esfera interceptada, respectivamente. O fluxo total Out[36] resulta da soma destes dois fluxos parciais. Como o raio a é maior que zero, o fluxo é sempre negativo, isto é, de fora para dentro da superfície. Concluise daí que as fontes de fluxo se localizam fora da superfície fechada. No interior, existem apenas sorvedouros. Exemplo simples vamos calcular o fluxo do campo ¢ ¢ Neste ¡ 2 exemplo ¡ 2.11: 2 ˆ através da superfície cilíndrica vetorial f = xz î + x y − z ˆj +y(2x+yz)k 2 2 x + y = 4 limitada pelos planos z = −2 e z = 2. A superfície cilíndrica fechada encontra-se graciosamente ilustradas na Figura 2.26. Ela é formada por três porções: o círculo basal, a superfície lateral cilíndrica e o círculo do topo. Feitas estas observações, o fluxo total é composto pela soma das integrais de superfície em cada uma dessas partes. Para se traçar a Figura 2.26 e fazer o cálculo do fluxo é preciso dispor da parametrização de cada uma das porções que compõem a superfície. Procedendo como nos exemplos anteriores, podemos escrever as parametrizações, de cada uma das partes, da seguinte maneira34 : 34
Lembre-se que a parametrização de uma superfície (ou de uma curva) é uma simples
2.3. INTEGRAIS DE LINHA, DE SUPERFÍCIE E DE VOLUME
69
2 y 1 0 -1 -2 2 1 z
0 -1 -2 -2 -1 0 x
1 2
Figura 2.26: Superfície cilíndrica fechada no teto e na base. ϕb (u, v) = (u cos v, u sin v, −2) em que 0 ≤ u ≤ 1, 2π ≤ v ≤ 0, ϕc (u, v) = (2 cos u, 2 sin u, v) em que 0 ≤ u ≤ 2π, −2 ≤ v ≤ 2, ϕt (u, v) = (u cos v, u sin v, 20 em que 0 ≤ u ≤ 1, 0 ≤ v ≤ 2π, em que os subscritos b, c e t denotam, respectivamente, base, superfície cilíndrica lateral e teto do cilindro secionado. Note que nas parametrizações dos círculos da base e do teto, o parâmetro v varia em direções opostas, para que ˆ e os vetores normais à base e ao teto tenham sinais contrários, isto é, −k ˆ +k, respectivamente. Para se traçar o gráfico da superfície esta distinção de sinal é irrelevante, mas, para o cálculo do fluxo ela é vital, pois a orientação da superfície se dá de dentro para fora da superfície. Dito isto, podemos traçar o gráfico da Figura 2.26: In[37]:= (*--- Figura 2.26:
Superfície
cilíndrica fechada ---*)
Os fluxos através do círculo da base, da superfície cilíndrica lateral e do círculo do teto se somam para compor o fluxo total. Portanto, podemos escrever: In[42]:= (*--- Cálculo do fluxo através da superfície mudança de variáveis. O leitor tem que se conscientizar disto e procurar descobrir a parametrização que melhor se coaduna ao problema a ser resolvido. É mister usar diferentes sistemas de coordenadas para tirar proveito da simetria do problema. A arte de formular a parametrização de uma superfície não é difícil, todavia, é preciso praticar um pouco para se obter experiência, como tudo na vida.
70
CAPÍTULO 2. CÁLCULO VETORIAL cilíndrica fechada---*) Clear[x, y, z, u, v] {fx, fy, fz}:= {x z^2, x^2 y - z, y (2 x + y z)}; {x, y, z} = {u Cos[v], u Sin[v], -2}; fluxoBase = integralDeSuperficie[x, y, z, v, u, fx, fy, fz, 0, 2, 2Pi, 0] {x, y, z} = {2Cos[u], 2Sin[u], v}; fluxoCilindrico = integralDeSuperficie[x, y, z, v, u, fx, fy, fz, 0, 2Pi, -2, 2] {x, y, z} = {u Cos[v], u Sin[v], 2}; fluxoTeto = integralDeSuperficie[x, y, z, v, u, fx, fy, fz, 0, 2, 0, 2Pi] fluxoSuperficie = fluxoBase + fluxoCilindro + fluxoTeto Out[45]:= 8π Out[47]:= 112π/3 Out[49]:= 8π Out[50]:= 160π/3
Em contraste com o exemplo anterior, agora o fluxo é positivo. Portanto, ele escoa através da superfície de dentro para fora. Isto indica que as fontes de fluxo se situam no interior do cilindro. Exemplo 2.12: Apertando um pouco o centro do cilindro da Figura 2.26, como se este fosse de borracha, obtém-se um hiperbolóide (Figura 2.27). Vamos ver o que acontece com fluxo do mesmo campo vetorial do exemplo anterior após feita esta deformação. A parametrização do hiperbolóide é expressa por: ϕh (u, v) = (cos u − v sin u, sin u + v cos u, v) em que 0 ≤ u ≤ 2π e −2 ≤ v ≤ 2. O teto e a base não mudaram, portanto a parametrização de ambos não se altera. De posse da parametrização das três superfícies, é simples traçar o gráfico do hiperbolóide fechado (Figura 2.27). Com efeito: In[51]:= (*--- Figura 2.27: na base ---*)
Superfície hiperbólica fechada no topo e
Da mesma maneira como no caso anterior é simples calcular o fluxo. De fato, é só repetir o mesmo procedimento: In[56]:= (*--- Cálculo do fluxo através do hiperbolóide
2.3. INTEGRAIS DE LINHA, DE SUPERFÍCIE E DE VOLUME
71
2 y 1 0 -1 -2 2 1 z
0 -1 -2 -2 -1 0 x
1 2
Figura 2.27: Hiperbolóide fechado na base e no topo. fechado ---*) Out[59]:= 8π Out[61]:= 912π/125 Out[63]:= 8π Out[64]:= 2912π/125
Como era de se esperar, os fluxos através dos círculos da base e do teto não foram alterados. Todavia, o fluxo através da parede lateral do hiperbolóide diminuiu com relação ao do cilindro. Este é um resultado coerente, pois com a diminuição do volume — do cilindro para o hiperbolóide — a quantidade de fontes internas diminuiu um pouco, é claro. Exemplo 2.13: Apertando ainda mais a cintura do hiperbolóide, chegase a um cone de duas folhas (Figura 2.28). Mantendo o mesmo campo vetorial, vamos calcular o fluxo através dessa nova superfície fechada. A parametrização da superfície lateral do hiperbolóide é expressa por: ϕcc (u, v) = (v cos u, v sin u, v) em que 0 ≤ u ≤ 2π e −2 ≤ v ≤ 2. A parametrização da base e a do teto já são conhecidas. De posse da parametrização das três superfícies, podemos traçar facilmente o gráfico da superfície fechada do cone de duas folhas, mostrado majestosamente na Figura 2.28: In[65]:= (*--- Figura 2.28:
Superfície fechada de um cone de
72
CAPÍTULO 2. CÁLCULO VETORIAL 2 y 1 0 -1 -2 2 1 z 0 -1 -2 -2 -1 0 x
1 2
Figura 2.28: Superfície cônica de duas folhas fechada na base e no topo. duas folhas ---*)
Procedendo como no caso anterior, calcula-se facilmente o fluxo através do cone. Portanto, In[70]:= (*--- Cálculo do fluxo através do cone fechado de duas folhas ---*) Out[73]:= 8π Out[75]:= 16π/5 Out[77]:= 8π Out[78]:= 96π/5
É claro que os fluxos parciais através da base e o teto continuam inalterados. Afinal de contas, os círculos da base e do topo não foram afetados pela deformação do hiperbolóide no cone. Já o fluxo através da parede lateral diminuiu ainda mais, em virtude da redução acentuada do volume limitado pela superfície do cone. Menor o volume, menor o número de fontes internas. Os resultados destes três últimos exemplos parecem bem coerentes, pois, intuitivamente, é razoável que o valor do fluxo dependa da geometria da superfície atravessada pelo fluxo. Será que este raciocínio é válido em geral? Ou será que existem campos vetoriais cujos fluxos não dependem da geometria da superfície fechada? Os próximos exemplos mostram que
2.3. INTEGRAIS DE LINHA, DE SUPERFÍCIE E DE VOLUME
73
isto pode acontecer,¡ de fato. Para ¢ ¡ tanto vamos ¢ considerar o campo veto2 2 ˆ e repetir os últimos três rial f = (2x + y)î − 3y − z /3 ˆj + x − 3y + z k exemplos. Exemplo 2.14: Iniciando com o cilindro do Exemplo 2.11 e procedendo do mesmo modo como antes, vem: In[79]:= (*--- Cálculo do fluxo através da superficie cilindrica fechada ---*) Out[82]:= 20π Out[84]:= −16π Out[86]:= −4π Out[87]:= 0
Uau! O fluxo total é igual a zero. O fluido que entra pela base e pela parede lateral do cilindro sai integralmente pelo teto. Conclui-se daí que as fontes de fluxo encontram-se fora da região limitada pelo cilindro. Exemplo 2.15: Deformando o cilindro no hiperbolóide do Exemplo 2.12 e procedendo de forma análoga, vem In[88]:= (*--- Cálculo do fluxo através do hiperboloide fechado ---*) Out[91]:= 20π Out[93]:= −16π Out[95]:= -4π Out[96]:= 0
Interessante! O fluxo total continua nulo, independentimente da deformação do cilindro no hiperbolóide. Exemplo 2.16 Deformando-se o hiperbolóide no cone de duas folhas do Exemplo 2.13, o valor do fluxo permanece igual a zero. De fato: In[97]:= (*--- Cálculo do fluxo através do cone fechado de de duas folhas ---*) Out[100]:= 20π Out[102]:= −16π Out[104]:= -4π
74
CAPÍTULO 2. CÁLCULO VETORIAL
1 0.5 z 0 -0.5 -1
2
0 -2 0
y
-2
x 2
Figura 2.29: Superfície toroidal. Out[105]:= 0
O leitor poderia questionar que estes exemplos não foram bem escolhidos, pois se não há fontes no interior do cilindro, com maior razão, não deveria haver fontes no interior do hiperbolóide e nem tão pouco dentro do cone de duas folhas. Em outras palavras, não seria novidade que os fluxos continuassem sendo zero, mesmo após as deformações do cilindro no hiperbolóide e deste no cone. O leitor tem razão. Por isso, vamos analisar outro exemplo, partindo de uma superfície fechada completamente diferente das três anteriores. Exemplo 2.17: Continuando com o mesmo campo vetorial, vamos determiar o fluxo através da superfície toroidal da Figura 2.29, parametrizada por ϕ (u, v) = ((2 + cos u) cos v, (2 + cos u) sin v, sin u), em que 0 ≤ u ≤ 2π e 0 ≤ v ≤ 2π}. De posse da parametrização, o traçado do gráfico do toro é feito assim: In[106]:= (*--- Figura 2.29:
Superfície toroidal---*)
Clear[u, v] toro = {(2 + Cos[u]) Cos[v], (2 + Cos[u]) Sin[v], Sin[u]}; ParametricPlot3D[Evaluate[toro], {u, 0, 2 Pi}, {v, 0, 2 Pi}, AxesLabel -> {”x”, ”y”, ”z”}];
2.3. INTEGRAIS DE LINHA, DE SUPERFÍCIE E DE VOLUME
75
O cálculo do fluxo é bem simples por se tratar de uma superfície suave e conexa. Portanto, In[109]:= (*--- Fluxo através da superfície toroidal ---*) Clear[x, y, z, u, v] {fx, fy, fz}:= {2 x + y, -3 y + z^2/3, x + 3 y^2 + z}; {x, y, z} = {(2 + Cos[u]) Cos[v], (2 + Cos[u]) Sin[v], Sin[u]}; integralDeSuperficie[x, y, z, u, v, fx, fy, fz, 0, 2Pi, 0, 2Pi] Out[112]:= 0
Ótimo, o fluxo continua sendo zero, não obstante a diferença entre a geometria do toro e das três superfícies anteriores. O leitor cético poderia retorquir, afirmando que o toro é muito simétrico e portanto ele não constitui ainda um bom exemplo para convencê-lo que o fluxo seria zero qualquer que fosse a superfície fechada. Tudo bem! O leitor sempre tem razão. Vamos, então, mostrar um exemplo radical. Para tanto escolhemos a superfície fechada de um caracol, ilustrada magnificamente na Figura 2.30. Realmente, trata-se de uma superfície exótica e totalmente assimétrica. Exemplo 2.18: Continuando com o mesmo campo vetorial vamos computar o fluxo através da superfície do caracol, fechada por um disco na extremidade mais larga. Para iniciar, precisamos da parametrização da superfície lateral e a do disco que tampa o caracol. A primeira é expressa por ϕca (u, v) = (u cos u[4+ cos(u + v)]/10, u sin u[4 + cos(u + v)]/10, u sin(u + v)/10), em que 0 ≤ u ≤ 4πe 0 ≤ v ≤ 2π de acordo com [85] e a segunda é dada por ϕd (u, v) = (5 − u cos u, 0, u sin u), em que 0 ≤ u ≤ 1 e 0 ≤ v ≤ 2π. De posse da parametrização do caracol e do disco é fácil traçar o gráfico mostrado na Figura 2.30. Com efeito: In[113]:= (*--- Figura 2.30: caracol ---*)
Superfície fechada do
O cálculo do fluxo através da superfície do caracol fechado segue o mesmo procedimento de antes. Então: In[114]:= (*--- Cálculo da integral do fluxo através do caracol fechado ---*) Out[120]:= 4π5 /1875
76
CAPÍTULO 2. CÁLCULO VETORIAL
z
1 0 -1
-4 -2 5
0
y
2.5 2
0 x -2.5 4
Figura 2.30: Superfície fechada do caracol. Out[122]:= −4π5 /1875 Out[123]:= 0
Formidável, o fluxo que entra pelo disco sai integralmente pela superfície lateral do caracol. O fluxo total continua sendo nulo. Definitivamente, podemos conjecturar que o fluxo do campo vetorial f = ˆ será sempre zero, independente da (2x + y)î −(3y − z 2 /3)ˆj +(x − 3y 2 + z)k geometria da superfície fechada em questão. Na verdade, o fluxo será sempre zero independente da forma e das dimensões da supperfície. Isto significa que as fontes que criam o campo estão localizadas no infinito! Dizer que o valor absoluto da integral de superfície de um campo vetorial não depende da geometria de uma dada superfície aberta é equivalente a dizer que o valor do fluxo através de qualquer superfície fechada orientada é identicamente zero. Por exemplo, os valores absolutos dos fluxos através do disco e do caracol do Exemplo 2.18 são absolutamente iguais e assim, não dependem da geometria dessas duas superfícies. Para provar esta verdade teríamos de testar todas as possíveis superfícies fechadas e orientadas ou desenvolver uma maneira mais prática de fazer isto. É óbvio que a primeira alternativa é inexeqüível. Então, não nos resta outra possibilidade a não ser encontrar um outro método mais simples para provar que o valor da integral independe da geometria da superfície. Isto nos faz lembrar a questão formulada na página 53 com respeito à integral de linha. Naquela ocasião, se questionava se dado um campo vetorial, a integral de linha seria ou não dependente do caminho. Campos vetoriais em que integrais de linha são
2.3. INTEGRAIS DE LINHA, DE SUPERFÍCIE E DE VOLUME
77
independentes do caminho e em que integrais de superfície independem da geometria da superfície, são campos muito especiais e desempenham papel relevante em eletromagnetismo. Mais adiante falaremos bastante sobre isto, e então, desenvolveremos algumas ferramentas matemáticas que facilitarão identificar rapidamente esses campos vetoriais especiais.
2.3.3
Integral de volume de um campo escalar
As integrais de linha e de superfície se aplicam a campo vetoriais, enquanto que integrais de volume se destinam a campo escalares. Assim, dado o campo escalar ψ (x, y, z) contínuo numa região V ⊂ R3 , a integral Z
ψ (x, y, z) dV ,
(2.23)
V
é denominada de integral de volume. Na prática, a função ψ (x, y, z) representa uma densidade volumétrica de alguma grandeza física, enquanto a integral de volume, por sua vez, mede a quantidade total desta grandeza na região V ⊂ R3 . Por exemplo, a integral de volume da densidade de carga elétrica ρ (x, y, z) , numa determinada região do espaço, mede a quantidade total de carga elétrica encerrada nesta região. O primeiro passo a ser tomado para se calcular a integral 2.23 é definir uma parametrização adequada para região V . Isto significa, como sabemos, substituir as variáveis x, y e z por outras variáveis, digamos r, u e v, para transformar a integral de volume em três integrais iteradas, normalmente mais simples de serem calculadas. Com isso, a integral de volume toma a forma: Z v1 Z u1 Z s1 ∂ (x, y, z) drdudv, (2.24) ψ[x(r, u, v), y(r, u, v), z(r, u, v] ∂ (r, u, v) v0 u0 s0 em que ∂ (x, y, z) /∂ (r, u, v) é o jacobiano da transformação do domínio da integral. O jacobiano é expresso pelo determinante, ([11], [35]), ¯ ∂x ∂y ∂z ¯ ¯ ¯ ∂r ¯ ¯ ∂r ∂r ¯ ∂ (x, y, z) ¯ ∂x ∂y ∂z ¯¯ . = ∂ (r, u, v) ¯¯ ∂u ∂u ∂u ¯¯ ¯ ∂x ∂y ∂z ¯ ∂v
∂v
∂v
78
CAPÍTULO 2. CÁLCULO VETORIAL
A exemplo das integrais de linha e de superfície, a integral de volume também é fácil de ser calcula com o Mathematica. Para tanto, basta traduzir literalmente a fórmula 2.24. Portanto,
In[1]:= (*--- integralDeVolume calcula integrais de volume ---*) integralDeVolume[x_, y_, z_, r_, u_, v_, funU_, r0_, r1_, u0_, u1_, v0_, v1_]:= Module[{jacobiano}, jacobiano = Det[Outer[D,{x, y, z}, {r, u, v}]] // Simplify; Integrate[funU jacobiano, {r, r0, r1}, {u, u0, u1}, {v, v0, v1}]]
Vejamos dois exemplo simples de uso da função integralDeVolume[...]: Exemplo 2.19: Qual a quantidade de vinho que cabe no cálice exibido na da Figura 2.31, parametrizado por ϕ (r, u, v) = (r sin 2u sin v, r sin 2u cos v, 2r sin u) em que 0 6 r 6 1, −π/10 6 u 6 π/3 e 0 6 v 6 2π? O gráfico do cálice é feito assim: In[2]:= (*--- Figura 2.31: Cálice de vinho ---*) Clear[u, v] ParametricPlot3D[{Sin[2u] Sin[v], Sin[2u] Cos[v], 2 Sin[u]}, {u, -Pi/8, Pi/3}, {v, 0, 2 Pi} AxesLabel -> {”x”,
”y”,
”z”}];
Para se determinar a quantidade de vinho, basta fazer ψ (x, y, z) = 1 e calcular o volume do cálice. Note que o parâmetro u varia de 0 a π/3 que corresponde à taça do cálice. Portanto, In[4]:= (*--- Cálculo da quantidade de vinho ---*) Clear[u, v, z, r, u, v, funP] funPn = 1; P{x, y, z} = {r Sin[2u] Sin[v], r Sin[2u] Cos[v], 2 r Sin[u]}; integralDeVolume[x, y, z, r, u, v, funU, 0, 1, 0, Pi/3, 0, 2 Pi] √ Out[7]:= 3 3π/10
Exemplo 2.20: Determinar a integral de volume do campo escalar ψ (x, y, z) = z sinh[x] + y no torso cilíndrico ilustrado na Figura 2.32 constituído pelo cilíndrico x2 +y 2 = 1, limitado pelos planos z = 0 e 3x−2z+6 = 0.
2.3. INTEGRAIS DE LINHA, DE SUPERFÍCIE E DE VOLUME 1-1 y
0.5
79
x -0.5
0
0
0.5
1
-0.5 -1
1 z 0
Figura 2.31: Cálice de vinho É fácil verificar que a parametrização do torso cilíndrico secionada pelos planos z = 0 e 3x − 2z + 6 = 0, é: ϕ (r, u, v) = (r cos u, r sin u, 3v(1 + r/2 cos u)) em que 0 6 r 6 1, 0 6 u 6 2π, 0 6 v 6 1. Daí, é imediato construir o gráfico do torso em questão. In[8]:= (*--- Figura 2.32:
Torso cilindrico ---*)
Sem muita conversa, a integral de volume é computada assim: In[13]:= (*--- Cálculo da integral de volume ---*) Clear[u, v, z, r, u, v, funU] funUn = Sinh[x] + y; {x, y, z} = {r Cos[u], r Sin[u], 3 v (1 + r/2 Cos[u]}; integralDeVolume[x, y, z, r, u, v, funU, 0, 1, 0, 2 Pi, 0, 1] Out[6]:= 39πBesselI[2, 1]
O resultado 9π BesselI[2, 1] significa 9π I2 (1), ou seja, o valor no ponto 1, da função modificada de Bessel de primeira espécie e ordem dois multiplicada por 9π. As funções de Bessel serão estudadas datalhadamente no sexto capítulo. Muitos outros exemplos de integral de volume serão vistos no decorrer do livro. Embora a integral de volume tenha sido definida para campos escalares em R3 é praxe se usar a mesma denominação para integrais em R2 . Usase também, nesse caso, o termo integral de área, mas, integral de volume é
80
CAPÍTULO 2. CÁLCULO VETORIAL
4
3
z
2
1
0 -1 -0.5 1
0
0.5 0 -0.5
0.5 -11
x
y
Figura 2.32: Torso do cilindro x2 + y 2 = 1, limitado pelos planos z = 0 e 3x − 2z + 6 = 0. mais apropriado. Portanto, não confundir integral de volume em uma região Ω ⊂ R2 com a integral de superfície definida anteriormente.
2.4
Os operadores: Curl, Div e Grad
No primeiro capítulo, as equações de Maxwell foram apresentadas de duas maneiras distintas: na forma integral e na forma diferencial. Das duas, a forma integral é a mais adequada na conceituação dos fundamentos físicos do eletromagnetismo. Ela serve também de ponto de partida para se obter as equações na forma diferencial, que é, normalmente, a forma empregada na solução de problemas práticos de eletromagnetismo. As equações de Maxwell na formatação diferencial, contêm dois operadores: o rotacional e a divergência. O primeiro é denotado pela abreviatura Curl 35 e o segundo pela abreviatura Div. Além desses dois operadores, há um terceiro operador denominado de gradiente ou simplesmente Grad, que embora não conste das equações de Maxwell, desempenha, também, papel fundamental em eletro35 Em português a abreviatura do rotacional é Rot. No entanto, neste livro vamos usar a abreviatura Curl por questão de compatibilidade com o Mathematica.
2.4. OS OPERADORES: CURL, DIV E GRAD
81
magnetismo. O operador rotacional é a ferramenta apropriada para testar se a integral de linha de um campo vetorial depende ou não do caminho. Por outro lado, o operador divergência permite saber se o fluxo de um campo vetorial através de uma superfície fechada é zero ou não. Estas questões foram levantadas no final da seção anterior e, como foi dito naquela ocasião, são importantíssimas em eletromagnetismo. Um operador é uma aplicação36 entre dois espaços vetoriais ou entre um espaço vetorial e um escalar e vice-versa. O operador rotacional transforma um espaço vetorial em um segundo espaço vetorial. O operador divergência transforma um espaço vetorial em um espaço escalar e o operador gradiente transforma um espaço escalar em um espaço vetorial. A Tabela 2.1.sintetiza essas operações.
Tabela 2.1: Operadores: Curl, Div e Grad Operador Integral Campo Campo Curl de linha vetorial =⇒ vetorial Div de superfície vetorial =⇒ escalar Grad de volume (R2 ) escalar =⇒ vetorial Estes três operadores guardam estreitas relações com as integrais de linha e de superfície. Na verdade, o operador rotacional é descendente da integral de linha de um campo vetorial ao longo de um caminho fechado. O operador divergência, por sua vez, associa-se ao fluxo de um espaço vetorial através de uma superfície fechada e orientada. Finalmente, o gradiente surge da integral de um campo escalar multiplicado por um campo de vetores unitários normais à superfície de integração. Nas próximas três subseções, estes operadores serão estudados minuciosamente37 , ([63], [65], [?]). 36 Lembre-se que aplicação é um termo genérico usado em matemática para designar função, funcional, operador, mapeamento, etc. 37 A maioria dos livros em eletromagnetismo pressupõe que o leitor tenha conhecimento prévio de alguns tópicos de cálculo avançado. Infelizmente nem sempre isto acontece. Por ser pré-requisito fundamental no estudo do eletromagnetismo decidimos apresentar um resumo detalhado destes tópicos, com ênfase nos seus aspectos físicos. É um resumo longo e até certo ponto repetitivo, mas acredito que vale a pena estudá-lo cuidadosamente. Repetir, repetir e repetir . . . , é assim que se aprende na prática. Lembre-se que "água mole em pedra dura, tanto bate até que fura".
82
2.4.1
CAPÍTULO 2. CÁLCULO VETORIAL
Rotacional
Foi dito acima que o rotacional e a integral de linha de um campo vetorial num caminho fechado têm muito em comum. Com efeito, o rotacional de um campo vetorial num ponto (x, y, z) é concebido como sendo o limite do quociente entre a integral de linha, do campo vetorial, ao longo de um caminho fechado — centrado em (x, y, z) — e a área circunscrita pelo caminho, quando esta tende a zero. A partir dessa idéia básica, vamos formalizar a definição matemática do operador rotacional e em seguida deduzir fórmulas práticas para o cálculo deste operador nos três sistemas usuais de coordenadas (cartesianas, cilíndricas e esféricas) Dados um campo vetorial definido numa região Ω do espaço R3 e um caminho C em torno de um ponto (x, y, z) qualquer desta região, e com a ajuda da Figura 2.33, o perador rotacional é definido da seguinte maneira:
Seja C um caminho fechado em torno de um ponto (x, y, z) e seja n ˆ o vetor unitário neste ponto, normal à superfície ∆S circunscrita pelo caminho C. Então, o rotacional, no ponto (x, y, z), do campo vetorial f diferenciável é um vetor na direção n ˆ de norma igual a 1 ∆S→0 ∆S
(curl f ) ·ˆ n = lim
Z
C
f ·ˆ tdl.
(2.25)
em que ˆ t é o campo de vetores tangentes ao caminho C.
Como acontece na maioria das definições em matemática, esta definição de rotacional não é intuitiva à primeira vista, e nem tão pouco, reveladora de algum conteúdo físico. Mesmo assim, não se desanime. Mais adiante veremos que por trás desta definição fria se esconde algo maravilhoso. Na verdade, na prática, não se usa diretamente esta definição, e sim, fórmulas mais simples a partir dela. A seguir veremos como obter estas fórmulas nos três sistemas de coordenadas: cartesianas, cilíndricas e esféricas.
2.4. OS OPERADORES: CURL, DIV E GRAD
83
z n^
C
>
^t z
y
x y
x Figura 2.33: Caminho fechado C em torno do ponto (x, y, z). Coordenadas Cartesianas Consideremos o espaço vetorial f = (fx , fy , fz ) e o caminho retangular Cx constituído pela união dos lados C1 , C2 , C3 e C4 do retângulo centrado no ponto (x, y, z) e situado num plano vertical perpendicular ao eixo x, como ilustra a Figura 2.34. Suponhamos, ainda, que os lados do retângulo sejam suficientemente pequenos para que o campo vetorial seja praticamente constante ao longo de cada um desses lados.
z y
c1
”(a)”, Ticks -> None,
DisplayFunction -> Identity]; p2 = PlotVectorField3D[curlF, {x, -1, 1}, {y, -1, 1}, {z, 1, 3}, PlotPoints -> 5, VectorHeads -> True, Axes -> True, PlotLabel ->
”(b)”, Ticks -> None,
DisplayFunction -> Identity]; Show[GraphicsArray[{p1, p2}], DisplayFunction -> $DisplayFunction];
Intuitivamente, a primeira impressão que se tem do rotacional é que ele se associa a algo que gira, que circula como se fosse um redemoinho. De certo modo, a Figura 2.37 reforça essa imagem. Isto nem sempre acontece. De fato, o rotacional de um campo vetorial pode existir sem que este apresente qualquer aspecto de circulação. O próximo exemplo mostra isto. Exemplo 2.24: Consideremos o campo vetorial f = (0, e−z , 0). É um campo muito simples, em que apenas a componente y é diferente de zero, e
2.4. OS OPERADORES: CURL, DIV E GRAD (a)
91 (b)
x
y
y
z
z
x
Figura 2.37: Graficos tridimensional do campo vetorial f (a) e do ∇ × f (b). assim mesmo, variando somente em z. O campo vetorial curl f = (e−z , 0, 0), é igualmente simples, sendo diferente de zero, apenas a primeira componente. Ambos estão ilustrados na Figura 2.38 abaixo:
In[13]:= (*--- Rotacional de f em coordenadas cartesianas ---*) Clear[x, y, z] campoF= {0, Exp[-z], 0}; curlF = Curl[campoF, Cartesian[x, y, z]] Out[15]:= {e−z , 0, 0 }
In[16]:= (*--- Figura 2.38:
Esboço gráfico do campo vetorial f e
de Curl[f] *)
Observe que não há nenhum indício de redemoinho no campo f . Apenas a variação em z é suficiente para gerar o campo ∇ × f , orientado na direção x, enquanto o campo original aponta na direção y. Para ilustrar como se dá esta transformação do campo f para o campo ∇ × f , vamos lançar mãos do pequeno torniquete, ilustrado na Figura 2.39.
92
CAPÍTULO 2. CÁLCULO VETORIAL (b)
(a)
y
y
z z
x
x
Figura 2.38: Gráficos tridimensional do campo vetorial f (a) e de ∇ × f (b).
Figura 2.39: Torniquete para monitorar o rotacional de um campo vetorial. Imagine o eixo do torniquete sendo orientado na direção z, em qualquer ponto do campo f . Como o campo f não varia no plano xy, o torniquete não sofrerá nenhum torque, e por conseqüência permanece imóvel. Analogamente, se o eixo do torniquete apontar na direção y, ele também permanecerá estático, visto que não há variação do campo f no plano xz. Mas, se o eixo for apontado na direção x, então o torniquete experimentará um torque em virtude da falta de balanceamento dos valores de f no plano yz. O torque no torniquete é devido à ação de uma força produzida pelo campo f . Por isso o campo f é caracterizado como um campo de força. Por outro lado, o campo ∇ × f é identificado como um campo de densidade de fluxo. Mais adiante entenderemos porque ∇ × f possui esta denomi-
2.4. OS OPERADORES: CURL, DIV E GRAD
(a)
(b)
93
(c)
Figura 2.40: Ilustração esquemática de como o rotacional se cancela no interior de um circuito fechado. nação. Esta distinção de campos vetoriais entre campos de força e campos de densidade de fluxo é fundamental para o entendimento da física do eletromagnetismo. Voltaremos, como já disse, a falar sobre isto mais adiante. De posse do operador rotacional estamos agora aptos a dar uma resposta simples, rápida e elegante à questão formulada na página 51, de como saber, a priori, se a integral de linha de um campo vetorial, entre dois pontos, depende ou não do caminho39 . Basta calcular o rotacional do campo vetorial. Se o rotacional for identicamente zero, a integral não depende do caminho. E pronto, é só isso! Um artifício heurístico, intuitivo, que ilustra esta afirmativa é sugerido pela Figura 2.40. Subdividindo sucessivamente a região circunscrita pelo caminho (a) em pequenas células fechadas, como em (b) e (c), e observando que as integrais de linha ao longo das fronteiras internas se cancelam mutuamente, resulta que a integral de linha ao longo do caminho externo (a) será zero, se as integrais de linha em torno das fronteiras de cada célula interna também assim o forem. Mas, é exatamente isto que acontece, se o rotacional do campo for, por hipótese, identicamente zero. De fato, nesse caso, as integrais de linha em torrno da fronteira em cada célula – considerada infinitamente pequena por força do limite em (2.25) – se anulam, e progressivamente, segundo o raciocínio acima, à medida que o tamanho das células aumenta, as integrais de linha permanecem iguais a zero, até atingir o contorno externo, onde a integral de linha será obviamente também zero. Agora, suponhamos que sejam dados dois pontos a e b e três caminhos diferentes 1, 2 e 3 ligando estes dois pontos, como mostra a Figura 2.41. Pode-se afirmar que as integrais de linha do campo vetorial independem dos caminhos 1, 2 e 3, se dado um caminho de volta, como por exemplo, o 39
Este tipo de campo vetorial é conhecido na literatura como campo conservativo.
94
CAPÍTULO 2. CÁLCULO VETORIAL
b 3
4
2
1
a Figura 2.41: Diferentes caminhos entre os pontos a e b. Os caminhos 1, 2 e 3 vão de a a b. O caminho 4 de b a a. caminho 4 na mesma figura, as integrais ao longo de cada caminho fechado forem nulas. Como acabamos de ver, isto acontece se o rotacional do campo vetorial for identicamente zero. Exemplo 2.25: Agora podemos entender porque a integral de linha do campo vetorial f = (5y 3 z + 4x cos y, 15xy 2 z − 2x2 sin y, 5xy3 − (cos z)/3), do Exemplo 2.6, página 49, não depende do caminho. O rotacional de f é identicamente zero. Com efeito: In[19]:= (*--- Rotacional de f em coordenadas cartesianas ---*) Clear[x, y, z] campoF= {5 y^3 z + 4 x Cos[y], 15 x y^2 z - 2 x^2 Sin[y], 5 x y^3 - Cos[z]/3}}; curlF = Curl[campoF, Cartesian[x, y, z]] Out[20]:= {0, 0, 0}
Coordenadas cilíndricas Em eletromagnetismo, além do sistema de coordenadas cartesianas usam-se, com freqüência, os sistemas de coordenadas cilíndricas e esféricas. Com uma simples transformação de variáveis é possível, a partir de (2.37), reescrever o rotacional nesses outros dois sistemas de coordenadas. Todavia, por razão pedagógica, é instrutivo repetir a mesma metodologia empregada acima para o caso das coordenadas cilíndricas também. Vamos, então, considerar o sistema de coordenadas cilíndricas. Sejam (r, θ, z) um ponto no espaço e Cr = C1 ∪ C2 ∪ C3 ∪ C4 um caminho fechado
2.4. OS OPERADORES: CURL, DIV E GRAD
95
z r
c2
2}
Out[5]:= −3 − 1/e
´ ³ 2 2 Exemplo 2.34: Dado o campo f = x2 − xey z , 2xy, ey z /y 2 calcular ∇ · f no ponto (x, y, z): In[6]:= (*--- Divergência de f em coordenadas cartesianas ---*) Clear[x, y, z] campoF = {x (x - Exp[y^2z]), -2 x y, Exp[y^2 z]/y^2}; divF = Curl[campoF, Cartesian[x, y, z]] Out[7]:= 0
De posse do operador divergência estamos agora aptos a dar uma resposta simples, rápida e elegante à questão formulada na página 70, de como saber, a priori, se o fluxo de um campo vetorial através de uma superfície fechada suave por partes é zero, independentemente da geometria da superfície. Basta calcular a divergência do campo vetorial. Se a divergência for identicamente zero, o fluxo independe da geometria da superfície. Trivial, não é? Um argumento heurístico, intuitivo, de verificar esta afirmativa é sugerido pela Figura 2.48. Subdividindo sucessivamente a região limitada pela superfície (a) em pequenos cubos fechados, como em (b) e (c), e observando que as integrais de superfícies através das faces dos cubos internos se cancelam mutuamente, resulta que o fluxo através da superfície externa (a) será zero, se o fluxo através da fronteira de cada cubo também assim o for. É exatamente isto o que acontece, se, por hipótese, a divergência for identicamente zero. Pois, nesse caso, a integral de superfície nas faces de cada cubo
108
CAPÍTULO 2. CÁLCULO VETORIAL
z
z y
y x
z
x (a)
y x
(b)
(c)
Figura 2.48: Esquema intuitivo para ilustrar que o fluxo através de uma superficie fechada é zero se a divergência do campo vetorial for identicamente nula. (infinitamente pequeno, por hipótese) se anula e de acordo com o raciocínio acima, à medida que o tamanho dos cubos aumenta, as integrais de superfície permanecem iguais a zero, até atingir a fronteira externa, onde o fluxo total será obviamente zero. Agora¡ entendemos¢ porque o fluxo do campo vetorial f = (2x + y)î −(3y− 2 ˆ abordado nos Exemplos 2.14, 2.15, 2.16, 2.17 e 2.18 z /3)ˆj + x − 3y 2 + z k é identicamente nulo, independentemente da forma geométrica da superfície, seja ela cilíndrica, hiperbolóide, cone de duas folhas, toroidal, caracol ou qualquer uma outra.. Afirmamos reiteradas vezes que o operador divergência transforma um espaço vetorial em um espaço escalar. O próximo exemplo mostra uma ilustração gráfica deste fato. ´ ³ 2 2 2 2 Exemplo 2.35: Dado o campo vetorial f = xe(−x −y ) , ye(−x −y ) , 0 , vamos calcular ∇· f . Em seguida, serão esboçados os gráficos do campo vetorial f e do campo escalar ∇· f . A representação gráfica de f será feita na forma de um campo de vetores e a do campo escalar ∇· f na forma de uma superfície no espaço tridimensional, como de praxe no caso de campos bidimensionais. Para traçar o gráfico de campo de vetores é preciso, antes, ativar o pacote Add-on: Graphics‘PlotField‘. Então: In[8]:= (*--- Ativa o pacote Add On:
Graphics‘PlotField‘ ---*)
15, PlotLabel -> {”x", ÿ", "z"}, DisplayFunction -> Identity], ContourPlot[divF, {x, -2, 2}, {y, -2, 2} ContourShading -> False, Contours -> 10, DisplayFunction -> Identity], p2 = Plot3D[divF, {x, -2, 2}, {y, -2, 2}, AxesLabel -> {”x”, ”y”,
”z”}, PlotLabel -> ”(b)”,
DisplayFunction -> Identity]; Show[GraphicsArray[{p1, p2}]; DisplayFunction -> $DisplayFunction];
O campo vetorial f está representado por setas imitando vetores (Figura 2.49a), enquanto que o campo escalar ∇·f está representado de duas maneiras: por curvas de níveis (Figura 2.49a) e por uma superfície em R3 (Figura 2.49b), como de costume quando se deseja representar tridimensionalmente
110
CAPÍTULO 2. CÁLCULO VETORIAL
funções de duas variáveis. Observe que os dois vales e os dois picos mostrados no gráfico da superfície que representa o campo ∇ · f também aparecem nitidamente nas curvas de níveis do mapa de contorno. Neste caso, se distinguem os picos dos vales pelo sentido das setas do campo de vetores que representa f . É claro que os gráficos mostrados aqui com campos bidimensionais poderiam, também, ser ampliados a campos tridimensionais. Nesse caso, as curvas de níveis dariam lugar às superfícies de níveis, o que tornaria mais difícil a visualização. Por isso decidimos usar, neste exemplo, um campo bidimensional. Coordenadas cilíndricas Procedendo-se de modo absolutamente análogo ao caso das coordenadas cartesianas, pode-se facilmente deduzir a fórmula da divergência de um campo vetorial em coordenadas cilíndricas. Se não, vejamos. No centro das faces S1 e S2 (Figura 2.50), temos:
z r
r S2
S1
z
z r
y
x Figura 2.50: Paralelepípedo cilíndrico, com destaque nas faces S1 (mais clara) e S2 (mais escura), perpendiculares ao eixo r.
¶µ ¶ µ ∆r ∆r , θ, z r+ ∆θ∆z f ·ˆ rds = fr (r, θ, z) ds ' fr r + 2 2 S1 S1
Z
Z
e ¶µ ¶ µ ∆r ∆r , θ, z r− ∆θ∆z f ·ˆ rds = − fr (r, θ, z) ds ' −fr r − 2 2 S2 S2
Z
Z
2.4. OS OPERADORES: CURL, DIV E GRAD
111
Adicionando estes dois resultados, multiplicando e dividindo por r∆r e fazendo o volume, ∆V = r∆r∆θ∆z, do paralelepípedo cilíndrico, tender a zero, obtém-se Z 1 f ·n ˆds lim ∆V →0 ∆V S1 ∪S2 ¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢ ∆r ∆r ∆r r + ∆r 2 fr r + 2 , θ, z − r − 2 fr r − 2 , θ, z = lim ∆r→0 r∆r 1 ∂ (rfr ) (2.59) = r ∂r Agora com relação às faces S3 e S4 (Figura 2.51a) e às faces S5 e S6 (Figura 2.51b) podemos escrever ¢ ¢ ¡ ¡ Z ∆θ fθ r, θ + ∆θ 1 ∂fθ 1 2 , z − fθ r, θ − 2 , z = lim f ·n ˆ ds = lim ∆V →0 ∆V S3 ∪S4 ∆r→0 r∆θ r ∂θ (2.60) e
z
z r
r S3
r
r S5
z
S4
z
S6
z
r
x
(a)
z
y
x
r
x
y
(b)
Figura 2.51: Paralelepípedo cilíndrico: (a) destaque das faces S3 (mais clara) e S4 (mais escura), perpendiculares ao eixo θ e (b) destaque das faces S5 (mais clara) e S6 (mais escura), normais ao eixo z.
1 lim ∆V →0 ∆V
Z
¡ fz r, θ, z +
∆z 2
¢
¡ − fz r, θ, z − ∆z
∆z 2
¢
∂fz ∆r→0 ∂z S5 +S6 (2.61) Somando as expressões (2.59), (2.60) e (2.61) chega-se à fórmula da divergência de um campo vetorial, em um ponto (r, θ, z) , no sistema de coordenadas cilíndricas. Simbolicamente, f ·n ˆ ds = lim
=
112
CAPÍTULO 2. CÁLCULO VETORIAL
div f =
∂fz 1 ∂ 1 ∂fθ (rfr ) + + r ∂r r ∂θ ∂z
(2.62)
Seguem alguns exemplos do cálculo da divergência de um campo vetorial, em coordenadas cilíndricas. Usa-se o mesmo comando Div[...], substituíndo a opção Cartesian[x, y, z] por Cylindrical[r, u, z]. Exemplo 2.36: Dado o campo vetorial f = (r cos u, r sin u, z), determinar ∇· f no ponto (r, u, z): In[15]:= (*--- Divergência de f em coordenadas cilíndricas ---*) Clear[r, u, z] campoF = {r Cos[u], r Sin[u], z}; divF = Div[campoF, Cylindrical[r, u, z]] // Simplify Out[16]:= 1 + 3 Cos[u]
³ ´ 3 Exemplo 2.37: Dado o campo vetorial f = rezu , e−zu /r, z 5 , computar ∇· f no ponto (2, π/4, 3): In[17]:= (*--- Divergência de f em coordenadas cilíndricas ---*) Clear[r, u, z] campoF = {r Exp[z u], Exp[-z u]/r, z^(3/5)}; divF = Div[campoF, Cylindrical[r, u, z]], /.
{r -> 2, u -> Pi/4 z -> 3}
// Simplify] Out[18]:= 33/5 /5 − 3 e−3π/4 /4 + 2 e3π/4
Exemplo 2.38: Dado o campo vetorial f = (3r cos u, −5r sin u, −z cos u), calcular ∇· f .no ponto (r, u, z): In[19]:= (*--- Divergência de f em coordenadas cilíndricas ---*) Clear[r, u, z] campoF = {3 r Cos[u], -5 r Sin[u], -z Cos[u]}; divF = Div[campoF, Cylindrical[r, u, z]] Out[20]:= 0
2.4. OS OPERADORES: CURL, DIV E GRAD
113
Coordenadas esféricas
Para finalizar, vejamos como obter a fórmula da divergência em coordenadas esférica. É só repetir os passos anteriores e pronto! A Figura 2.52 ajuda escrever
z
r sin S1
r
S2
r
r
y x Figura 2.52: Paralelepípedo esférico, com destaque nas faces S1 (mais clara) e S2 (mais escura), perpendiculares ao eixo r.
1 lim ∆V →0 ∆V
Z
S1 ∪S2
f ·n ˆds = =
¡ fr r + 1 lim r2 ∆r→0 1 ∂ ¡ 2 ¢ r fr , r2 ∂r
¢
∆r 2 , θ, φ
¡ − fr r − ∆r
¢
∆r 2 , θ, φ
(2.63)
com relação às faces S1 e S2 . Analogamente, com relação as outras quatro faces, ilustradas na Figura 2.53a e b, podemos escrever
114
CAPÍTULO 2. CÁLCULO VETORIAL
z
z
r sin
r sin
r
r
S4
S6 S3
r
r
r
x
(a)
r
y
y x
S5
(b)
Figura 2.53: Paralelepípedo esférico com destaque: (a) das faces S3 (mais clara) e S4 (mais escura), perpendiculares ao eixo θ e (b) das faces S5 (mais clara) e S6 (mais escura), normais ao eixo φ.
1 lim ∆V →0 ∆V = =
Z
f ·n ˆds ¡ sin θfθ r, θ +
S3 ∪S4
1 lim r sin θ ∆θ→0 1 ∂ (sin θfθ ) r sin θ ∂θ
e 1 ∆V →0 ∆V lim
= =
Z
S5 ∪S6
1 lim r sin θ ∆φ→0 1 ∂fφ r sin θ ∂φ
¡ − sin θfθ r, θ − ∆θ
¢
∆θ 2 ,φ
¢
∆θ 2 ,φ
(2.64)
f ·n ˆds
³ fφ r, θ, φ +
∆φ 2
´
³ − fφ r, θ, φ −
∆φ 2
∆φ
´ (2.65)
Finalmente, somando as expressões (2.63), (2.64) e(2.65) obtém-se a fórmula da divergência em coordenadas esféricas. Portanto, div f =
1 ∂ ¡ 2 ¢ 1 ∂fφ 1 ∂ (sin θfθ ) + . r fr + 2 r ∂r r sin θ ∂θ r sin θ ∂φ
(2.66)
A esta altura, o cálculo da divergência, em coordenadas esféricas com o Mathematica dispensa qualquer comentário.Vejamos, então, alguns exemplos.
2.4. OS OPERADORES: CURL, DIV E GRAD
115
Exemplo 2.39: ¡Calcular no ponto (r, u, v) a divergência do campo ve¢ −iu −iv cos v, re sin u, ln (ruv) : torial f definido por re In[21]:= (*--- Divergência de f em coordenadas esféricas ---*) Clear[r, u, v] campoF = {r Exp[-u] Cos[v], r Exp[-v]Sin[u], Log[r u v]}; divF = Div[campoF, Spherical[r, u, v]] // Simplicity Out[22]:= 2 e−v Cos[u] + 3 e−u Sin[v] + Csc[u]/ (r v)
¡ ¢ Exemplo 2.40: Dado f = r tan u, r tan v, r2 sin u cos v , computar ∇ · f no ponto (5, π/6, π/3): In[23]:= (*--- Divergência de f em coordenadas esféricas ---*) Clear[r, u, v] campoF = {r Tan[u], r Tan[v], r^2 Sin[u] Cos[v]}; divF = Div[campoF, Spherical[r, u, v]] /. {r -> 5, u -> Pi/6, v -> Pi/3} // Simplicity √ Out[24]:= 3 − 3 3/2
Exemplo 2.41: Dado f = ((r sin v)/3, csc u, r sin u cos v), calcular a∇ · f no ponto (r, u, v): In[25]:= (*--- Divergência de f em coordenadas esféricas ---*) Clear[r, u, v] campoF = {r Sin[v]/3, Csc[u], r Sin[u] Cos[v]}; divF = Div[campoF, Spherical[r, u, v]] Out[26]:= 0
A divergência, a exemplo do rotacional, é um operador linear. Assim, dados os campos vetoriais f e g e as constantes α e β é fácil mostrar que ∇ · (αf + βg) = α∇ · f + β∇ · g
(2.67)
Outro resultado importante: Se o campo vetorial f for de classe C 2 , verifica-se a seguinte igualdade40 : ∇ · (∇ × f ) = 0. 40
(2.68)
Um campo vetorial é de classe C 2 se suas componentes forem duas vezes continuamente diferenciáveis. Uma função é dita continuamente diferenciável se possui derivada contínua [7].
116
CAPÍTULO 2. CÁLCULO VETORIAL Com efeito, µ ¶ µ ¶ µ ¶ ∂fy ∂ ∂fx ∂fz ∂ ∂fy ∂fx ∂ ∂fz − + − + − ∂x ∂y ∂z ∂y ∂z ∂x ∂z ∂x ∂y 2 2 2 2 2 2 ∂ fy ∂ fy ∂ fx ∂ fz ∂ fx ∂ fz − + − + − =0 ∂x∂y ∂x∂z ∂y∂z ∂y∂x ∂z∂x ∂z∂y
∇ · (∇ × f ) = = 2
2
∂2f
∂2f
2
2
∂ fz ∂ fz ∂ fx ∂ fx em virtude de ∂x∂y = ∂y∂x , ∂x∂zy = ∂z∂xy e ∂y∂z = ∂z∂y por ser f de classe 2 C . Embora tenha sido usado o sistema de coordenadas cartesianas, é fácil ver que este resultado é válido em qualquer um dos três sistemas de coordenadas. Observe que não há sentido falar em ∇ × (∇ · f ), pois ∇ · f é um campo escalar e obviamente não se pode falar de rotacional de um campo escalar. A esta altura, o leitor, provavelmente, estará se perguntando. Depois de tanto algebrizar qual o significado físico do operador divergência? Bom, a resposta verá logo em breve. Tenha paciência, falta pouco.
2.4.3
Gradiente
Acabamos de ver que o operador divergência transforma campo vetorial em campo escalar. É natural, então, perguntar se existe um operador que faça exatamente o contrário, isto é, transforme campo escalar em campo vetorial. Este operador existe e se chama gradiente. Na subseção 2.4.1 foi visto que o valor da integral de linha de um campo vetorial independe do caminho se, e somente se, o seu rotacional for identicamente zero. Identificar se um campo é conservativo não é o bastante, é preciso saber construí-lo. No final desta subseção veremos como construir campos conservativos com o auxílio do operador gradiente. Seguindo o mesmo raciocínio usado nas definições do rotacional (2.31) e da divergência (2.54), vamos definir o operador gradiente de um campo escalar ψ (x, y, z) diferenciável como sendo o limite do quociente da integral do produto ψ (x, u, z) n ˆ – em que n ˆ é o campo de vetores normais à superfície fechada ∂V que limita uma região V – pelo volume de ∆V , quando este tende à zero. Simbolicamente, o gradiente é expresso assim: 1 grad ψ = lim ∆V →0 ∆V
Z
∂V
ψ (x, u, z) n ˆds.
(2.69)
2.4. OS OPERADORES: CURL, DIV E GRAD
117
Ao contrário das definições do rotacional e da divergência, esta definição do gradiente não tem o mesmo apelo físico das duas primeiras, alicerçadas nas integrais de linha e de superfície. Mesmo assim, ela é muito útil para se deduzir as fórmulas do operador gradiente, nos três sistemas (cartesiano, cilíndrico e esférico) de coordenadas, usadas no dia-a-dia. Veremos que o significado físico do gradiente brotará naturalmente da análise dessas fórmulas. Coordenadas cartesianas Utilizando o mesmo paralelepípedo ilustrado nas Figuras 2.46 e 2.47(a e b) podemos cálcular a integral (2.69) nas seis faces, devidir pelo volume do paralelepípedo e em seguida fazê-lo tender para zero. Com efeito, supondo que os¡ lados do paralelepípedo sejam suficientemente pequenos, de modo ¢ ∆x que ψ x + 2 , y, z seja praticamente constante sobre a face S1 , normal ao eixo x, podemos escrever ¶ µ Z ∆x , y, z ∆y∆zî. ψ (x, y, z) n ˆds ' ψ x + 2 S1 Analogamente, com relação à face S2 , vem: ¶ µ Z ∆x , y, z ∆y∆zî, ψ (x, u, z) n ˆds ' −ψ x − 2 S2 em que o sinal negativo vem do fato da orientação de S2 ser contrária a de S1 . Somando-se essas duas integrais e multiplicando e dividindo por ∆x, resulta: " ¡ ¢ ¡ ¢# Z ∆x ψ x + ∆x , y, z − ψ x − , y, z 2 2 ψ (x, u, z) n ˆds ' ∆x∆y∆zî. ∆x S1 ∪S2 Dividindo ambos os lados desta expressão por ∆V = ∆x∆y∆z e fazendo as faces do paralelepípedo tenderem a zero, chega-se a Z 1 ψ (x, u, z) n ˆ ds lim ∆V →0 ∆V S1 ∪S2 " ¡ ¢ ¡ ¢# ∆x ψ x + ∆x ∂ψ 2 , y, z − ψ x − 2 , y, z î= î. (2.70) = lim ∆x→0 ∆x ∂x
118
CAPÍTULO 2. CÁLCULO VETORIAL
Procedendo-se absolutamente do mesmo modo com relação às faces S3 e S4 e às faces S5 e S6 (Figura 2.47a e b) podemos escrever Z 1 ∂ψ ˆj, (2.71) ψ (x, u, z) n ˆds = lim ∆V →0 ∆V S3 ∪S4 ∂y e
1 lim ∆V →0 ∆V
Z
ψ (x, u, z) n ˆds =
S5 ∪S6
∂ψ ˆ k. ∂z
(2.72)
Somando-se as integrais (2.70), (2.71) e (2.72), concluímos de (2.69) que grad ψ =
∂ψ ∂ψ ˆ ∂U î + ˆj + k. ∂x ∂y ∂z
(2.73)
. A exemplo dos operadores rotacional e divergência, é convenientese usar ∂ ∂ ∂ ˆ k (página 86) e reescrever formalmente î + ∂y ˆj + ∂z o ”vetor ” nabla 5 = ∂x o gradiente de ψ, (2.73), da seguinte maneira: ¶ µ ∂ ∂ ˆ ∂ψ ∂ψ ∂ψ ˆ ∂ î + ˆj + k ψ = î + ˆj + k. (2.74) 5ψ = ∂x ∂y ∂z ∂x ∂y ∂z Agora chegou a hora clarificar o significado físico do operador gradiente, como prometido a pouco. O conceito de gradiente está inseparavelmente ligado ao conceito de derivada direcional de um campo escalar. Com efeito, dado um campo escalar ψ (x, y, z), o seu diferencial no ponto p é dado por dψ =
∂ψ ∂ψ ∂ψ ∂ψ dl = dx + dy + dz, ∂l ∂x ∂y ∂z
(2.75)
em que ∂ψ/∂l é a derivada direcional41 de ψ ao longo do segmento dl que liga o ponto p a um ponto q A direção do ponto p ao ponto q é dada pelo vetor dl. Logo, o diferencial também pode ser reescrito assim: dψ = g · dl, 41
(2.76)
A derivada direcional de ψ ao longo do segmeto de reta que liga o ponto p ao ponto q é dada por ∂ψ ψ (p) − ψ (q) = lim . ∆l→0 ∂l ∆l du Em uma dimensão o diferencial é dado por du = du dx dx em que dx é a derivada da função u em relação à variável x.
2.4. OS OPERADORES: CURL, DIV E GRAD
119
em que ∂ψ/∂l equivale a projeção do vetor g em dl. Afinal de contas, que vetor g é este? Ele corresponde, exatamente, ao gradiente de ψ no ponto (x, y, z). Com efeito, dados um campo escalar ψ e um ponto (x, y, z) qualquer; qual seria a direção do vetor dl que corresponderia ao valor máximo de dψ neste ponto? Obviamente, quando as direções de g e dl coincidirem. Neste caso, é claro que g = grad ψ e dl = (dx, dy, dz) por força de (2.75) e (2.76). A moral da história é que o gradiente de ψ, num determinado ponto (x, y, z), indica a direção onde há maior variação de ψ, neste ponto, além disso, o valor absoluto do gradiente é igual o da derivada direcional na direção de maior declividade. Em símbolo, µ ¶ ∂ψ na direção do grad ψ. kgrad ψk = ∂l max O cálculo do gradiente com o Mathematica é tão simples quanto o do rotacional e da divergência já estudados. Vejamos alguns exemplos: In[1]:= (*--- Ativa pacote Add On:
Calculus‘VectorAnalysis‘ ---*)
2/3, z -> 1/2}
120
CAPÍTULO 2. CÁLCULO VETORIAL
√ Exemplo 2.44: Dado ψ = a b, calcular ∇ψ no ponto (x, y, z) sendo a e b constantes: In[6]:= (*--- Gradiente do campo escalar Qsi em coordenadas cartesianas ---*) Clear[a, b, x, y, z] campoQsi = a Sqrt[b]; gradQsi = Grad[campoQsi,Cartesian[x, y, z]] Out[7]:= {0, 0, 0}
Exemplo 2.45: Dado o campo escalar ψ (x, y) = sin (xy) vamos representar graficamente ψ de duas maneiras: na forma de uma superfície no espaço tridimensional e em curvas de nível. Sobre as curvas de nível será traçado o campo de vetores correspondente ao gradiente de ψ. Para se traçar o campo de vetores é preciso, primeiro, carregar o pacote Add-on: Graphics‘PlotField‘. Assim: In[8]:= (*--- Ativa o pacote Add On: None, PlotLabel -> ”(a)”, DisplayFunction -> Identity]; p2 = Show[ContourPlot[funQsi, {x, -2, 2}, {y, -2, 2}, ContourShading -> False, Contours -> 10, PlotLabel -> ”(b)”, DisplayFunction -> Identity], PlotGradientField[funQsi, {x, -2, 2}, {y, -2, 2}, PlotPoints -> 10, DisplayFunction -> Identity]]; Show[GraphicsArray[{p1, p2}], DisplayFunction -> $DisplayFunction];
Comparando as Figuras 2.54a e b vê-se nitidamente que o vetor gradiente aponta para a direção de maior crescimento de ψ. Quanto mais íngreme é a
2.4. OS OPERADORES: CURL, DIV E GRAD
121
(a) 2
1
funU
0
-1
y
x
-2 -2
-1
0
1
2
Figura 2.54: O campo de vetores mostrado em (b) corresponde ao gradiente do campo escalar correspondente à superfície ilustrada em (a).
superfície, maior é módulo do vetor. O sentido do vetor é da menor para a maior elevação da superfície. Observe a perpendicularidade entre os vetores que representam o gradiente e as curvas de níveis do campo escalar ψ. Ao contrário das curvas de nível dos campos bidimensionais, as superfícies de nível de campos tridimensionais são, em geral, difícies de se visualizar. Os dois exemplos a seguir mostram as superfícies de nível de dois campos bem simples. Com esses exemplos podemos antever a dificuldade de visualizar campos mais complexos. Para traçar superfícies de nivel devemos ativar o pacote Add on: Graphics‘ContourPlot3D‘. Então,
In[14]:= (*--- Ativa o pacote Add On:
Graphics‘ContourPlot3D‘ ----*)
{1,1,1}, Axes -> True, AxesLabel -> {"x", "y", "z"}, PlotPoints -> 5];
Observe que as superfícies de nível são camadas concêntricas identificadas pelo corte transversal na figura. Se a figura fosse totalmente fechada não seria possível identificar as superfícies de nível internas, a não ser que se fizessem "buracos"na superfície de nível mais exterior para se pudesse observar as camadas internas. É isto que faremos no próximo exemplo. Exemplo 2.47: Traçar as superfícies de nivel {c =.5, 1.5} do campo escalar ψ = x2 + y 2 + z 2 . In[16]:= (*--- Figura 2.57:
Superfícies de nível do campo escalar
x^2 + y^2 + z^2.---*) lista = Table[x^2 + y^2 + z^2, {x, -1, 1,.25}, {y, -1, 1,.25}, {z, -1, 1,.25}]; ListContourPlot3D[lista, MeshRange -> {{-1,1},{-1,1},{-1,1}}, Contours -> {.5, 1.5}, Axes -> True, AxesLabel -> {"x", "y", "z"}];
2.4. OS OPERADORES: CURL, DIV E GRAD
y 0.5 0
123
1
-0.5 -1 1 0.5 z 0 -0.5 -1 -1 -0.5 0 x
0.5 1
Figura 2.56: Superfície de nivel do campo escalar x2 + y 2 + z 2 . Note os "buracos" feitos na superfície de nível externa para se ver a superfície de nível interna. Neste exemplo as superfícies de nível são superfícies esféricas concêntricas. As superfícies externas escondem as internas, por isso usamos o expediente dos "buracos" de observação. Coordenadas cilíndrica Usando-se o paralelepípedo cilíndrico das Figuras 2.50 e 2.51(a e b) e os mesmos argumentos empregados no desenvolvimento da fórmula do gradiente em coordenadas cartesianas, pode-se mostrar facilmente que, em coordenadas cilíndricas, o gradiente é expresso por: grad ψ =
1 ∂ψ ˆ ∂ψ ∂ψ ˆ r+ θ+ ˆ z. ∂r r ∂θ ∂z
(2.77)
Dito isto, vejamos alguns exemplos do cálculo do gradiente em coordenadas cilíndricas. Exemplo 2.48: Dado o campo escalar ψ = re−uz − reuz , determinar ∇ψ no ponto (r, u, z): In[18]:= (*--- Gradiente do campo escalar Qsi em coordenadas cilíndricas ---*) Clear[r, u, z] campoQsi = r Exp[-u z] - r Exp[u z];
gradQsi = Grad[campoQsi, Cylindrical[r, u, z]] // Simplify
124
CAPÍTULO 2. CÁLCULO VETORIAL Out[19]:= {e−v z − ev z , −e−v z 1 + e2 v z z, −e−v z 1 + e2 v z u v}
Exemplo ¡2.49: Dado o campo escalar ψ = 2r cos u + 5z sin u, computar √ ¢ ∇ψ no ponto 2, π3 , π : In[20]:= (*--- Gradiente do campo escalar Qsi em coordenadas cilíndricas ---*) Clear[r, u, z] campoQsi = 2 r Cos[u] + 5 z Sin[u]; gradQsi = Grad[campoQsi, Cylindrical[r, u, z]] /.
{u -> 2, v -> Pi/3, z -> Sqrt[Pi]}
// Simplify √ √ √ Out[21]:= {1, − 3 + 5 π/4, 5 3/2}
Exemplo 2.50: Dado o campo escalar ψ = a sin b, calcular ∇ψ no ponto (r, u, z) sendo a e b constantes: In[22]:= (*--- Gradiente do campo escalar Qsi em coordenadas cilíndricas ---*) Clear[a, b, r, u, z] campoQsi = a Sin[b]; gradQsi = Grad[campoQsi,Cylindrical[r, u, z]] // Simplify Out[23]:= {0, 0, 0}
Coordenadas esféricas Para comcluir, resta, apenas, apresentar a fórmula do grad ψ em coordenadas esféricas. Usando-se os paralelepípedos esféricos das Figuras 2.52 e 2.53(a e b) e repetindo, literalmente, tudo que nos dois casos anteriores, podemos escrever: grad ψ =
1 ∂ψ ˆ 1 ∂ψ ˆ ∂ψ ˆ r+ θ+ φ ∂r r ∂θ r sin θ ∂φ
(2.78)
Seguem alguns exemplos do cálculo do grad ψ em coordenadas esféricas com o Mathematica: Exemplo 2.51: Dado o campo escalar ψ = r cos v + r2 csc u, determinar ∇ψ no ponto (r, u, v):
2.4. OS OPERADORES: CURL, DIV E GRAD
125
In[24]:= (*--- Gradiente do campo escalar Qsi em coordenadas esféricas ---*) Clear[r, u, v] campoQsi = r Cos[v] + r^2 Csc[u]; gradQsi = Grad[campoQsi, Spherical[r, u, v]] // Simplify Out[25]:= {Cos v + 2 r Csc u, −r Cot u Csc u, − Csc u Sin v}
√ Exemplo 2.52: Dado o campo escalar ψ = 2 2r cos2 u sin3 v, computar ∇ψ no ponto (4000, −π/4, π/4): In[26]:= (*--- Gradiente do campo escalar Qsi em coordenadas esféricas ---*) Clear[r, u, v] campoQsi = 2 Sqrt[2] r Cos[u]^2 Sin[v]^3; gradQsi = Grad[campoQsi, Spherical[r, u, v]] /.
{r -> 4000, u -> -Pi/4, v -> Pi/4}
Out[27]:= {1/2, 1, − 3/2}
Exemplo 2.53: Dado campo escalar ψ = pq , calcular ∇ψ no ponto (r, u, v), sendo p e q constantes: In[28]:= (*--- Gradiente do campo escalar Qsi em coordenadas esféricas ---*) Clear[r, u, v] campoQsi = p^q; gradQsi = Grad[campoQsi, Spherical[r, u, v]] Out[29]:= {0, 0, 0}
A exemplo do rotacional e da divergência, o gradiente também é um operador linear. Isto significa que dados os campos escalares ψ 1 e ψ 2 e as constantes α e β tem-se: ∇ (αψ 1 + βψ 2 ) = α∇ψ 1 + β∇ψ 2
2.4.4
(2.79)
Operador elíptico
Revendo a Tabela 2.1, observa-se que o operador rotacional transforma campo vetorial em outro campo vetorial. O operador divergência transforma campo vetorial em campo escalar e o operador gradiente faz o inverso, ou seja, transforma campo escalar em campo vetorial. Para fechar o ciclo
126
CAPÍTULO 2. CÁLCULO VETORIAL
completo, cabe a seguinte pergunta. E o operador que transforma campo escalar em outro campo escalar? Nos moldes dos três operadores até aqui estudados não existe tal operador. Entretanto é possível construído a partir dos operadores gradiente e divergência um novo operador com essa característica de transformar campo escalar em um segundo campo escalar. Com efeito, dados os campos escalares não nulos ψ (x, y, z), k (x, y, z) e p (x, y, z) e aplicando o operador divergência ao produto k (x, y, z) grad ψ, vem, em coordenadas cartesians: µ ¶ µ ¶ µ ¶ ∂ψ ∂ ∂ψ ∂ ∂ψ k + k + k + pψ. ∂x ∂y ∂y ∂z ∂z (2.80) Como se observa, a combinação ∇ · (k5) + p transforma o campo escalar ψ em um novo campo escalar. Esta combinação é muito importante e leva o nome de operador elíptico. A importância do operador elíptico está no seguinte problema, denomonado de problema de contorno: ∇ · (k (x, y, z) 5 ψ) + pψ =
∂ ∂x
Dados os campos escalares k (x, y, z), p (x, y, z) e h (x, y, z) numa região Ω ⊂ R3 , determinar o campo escalar ψ (x, y, z) que satisfaz a equação ∇ · (k (x, y, z) 5 ψ) + pψ = h (x, y, z) ,
(2.81)
sujeito a certas condições na fronteira ∂Ω da região Ω.. Este é um dos problemas fundamentais em eletromagnetismo. Os capítulos quatro, seis e oito serão dedicados exclusivamente a este problema. No caso particular de k (x, y, z) ≡ 1 e p (x, y, z) ≡ 0 o operador elíptico (2.80) se reduz a µ ¶ µ ¶ µ ¶ ∂ ∂ψ ∂ ∂ψ ∂ ∂ψ 5 · 5ψ = + + ∂x ∂x ∂y ∂y ∂z ∂z ou simbolicamente, ∆ψ =
∂2ψ ∂2ψ ∂2ψ + + , ∂x2 ∂y 2 ∂z 2
em que se usou a abreviatura ∆ para designar a expressão simbolica 5 · 5. Este operador elíptico especial é denominado de Laplaciano42 . Neste caso 42
O operador Laplaciano ∇ · ∇ é comumente simbolizado por ∇2 . Todavia, a tendência
2.4. OS OPERADORES: CURL, DIV E GRAD
127
particular, a equação (2.81) se reduz a ∆ψ = h (x, y, z) ,
(2.82)
denominada de equação de Poisson. Resumindo, podemos afirmar: Em coordenadas cartesianas a equação de Posson tem a forma: ∂2ψ ∂2ψ ∂2ψ + + = h (x, y, z) . ∂x2 ∂y 2 ∂z 2
(2.83)
. Em coordenadas cilíndricas: 1 ∂ r ∂r
µ ¶ ∂ψ 1 ∂ 2ψ ∂ 2ψ r + 2 2 + = h (x, y, z) . ∂r r ∂θ ∂z 2
(2.84)
E em coordenadas esféricas:
1 ∂ r2 ∂r
µ ¶ µ ¶ 1 ∂ψ 1 ∂2ψ 2 ∂ψ = h (x, y, z) . (2.85) r + 2 sin θ + 2 ∂r r sin θ ∂θ r sin θ ∂φ2
A equação de Poisson homogênea — aquela em que a função h (x, y, z) é identicamente nula — é denominada de equação de Laplace. A exemplo do operador elíptico, muitas outras identidades podem ser obtidas combinando os operadores rotacional, divergência e gradiente. Todavia, é preciso prestar atenção se uma determinada combinação é admissível ou não. Por exemplo, o operador gradiente aplicado a um campo vetorial ou o operador rotacional aplicado a um campo escalar não são operações admissíveis. Dados os campos vetoriais f e g e os campos escalares ψ e φ, as seguintes combinações são totalmente legítimas e serão muito úteis no decorrer do livro: moderna é substituir o símbolo ∇2 por ∆, [?]. Uma das vantagens desta nova simbologia é eliminar a impressão de que o operador ∇2 = ∇ · ∇ só se aplica ao sistema de coordenadas cartesianas.
128
CAPÍTULO 2. CÁLCULO VETORIAL
5 × (ψf ) = ψ 5 ×f − f × 5 ψ,
5 × (φ 5 ψ) = 5φ × 5ψ,
(2.86) (a)
5 × (5ψ) = 0,
(b)
5 · (5 × f ) = 0,
(d)
5 · (f × g) = g· 5 × (f ) − f · 5 ×g, 5 · (ψf ) = ψ∇ · f + f · ∇ψ, ∇ (ψV ) = ψ∇φ + φ∇ψ, ∆f
= ∇ (∇ · f ) − ∇ × ∇ × f .
(c) (e) (f) (g)
Nesta última identidade, ∆f siginifica (∆fu , ∆fv , ∆fw ) independente do sistema de coordenadas utilizado.
Afirmamos a pouco que não basta identificar se um campo vetorial é conservativo ou não. É preciso em muitas situações, construir campos vetoriais com esta característica. Para tanto, basta usar a identidade (2.86b). Com efeito, esta identidade garante que um campo vetorial formado pelo gradiente de um campo escalar é conservativo. Em outras palavras, a integral de linha de um campo vetorial independo do caminho se o campo vetorial for o gradiente de algum campo escalar, pois que neste caso o seu rotacional é obviamente zero. O campo escalar em questão é denominado de campo potencial. No próximo capítulo, teremos muito que falar sobre campo potencial. A essa altura, o leitor, atordoado com tantas fórmulas, perguntaria. Se o Mathematica é tão "inteligente" e sabe tudo sobre rotacional, divergência e gradiente, por que se gastou tanto tempo deduzindo fórmulas e mais fórmulas desses operadores? A resposta é que em eletromagnetismo não basta apenas saber manipulá-los algébrica e computacionalmente, é preciso muito mais do que isto. É mister conhecer profundamente o significado físico de cada um desses operadores. Os próximos três teoremas, além de serem ferramentas imprescindíveis ao eletromagnetismo, contribuem, de forma decisiva, na interpretação do significado físico de tudo que foi falado até aqui, neste segundo capítulo. De fato, eles sintetizam tudo que vimos sobre integral de linha, integral de superfície, integral de volume, rotacional, divergência e gradiente.
2.5. TEOREMAS DO CÁLCULO VETORIAL
2.5
129
Teoremas do Cálculo Vetorial
Na última seção, a definição do rotacional de um campo vetorial foi apresentada a partir da integral de linha e a definição da divergência a partir da integral de superfície, uma, independente da outra. Agora, chegou a hora de inter-relacionar estes quatro objetos matemáticos — integral de linha, integral de superfície, rotacional e divergência. Este inter-relacionamento será feito por intermédio de dois teoremas famosos: o teorema de Stokes e o teorema de Gauss, também chamado de teorema da divergência. Eles formam o terceiro e o quarto pilares mestres do eletromagnetismo43 .
2.5.1
Teorema de Stokes
O teorema de Stokes é um dos mais importantes e fascinantes de toda matemática. Ele tem uma longa e curiosa história O teorema foi provavelmente descoberto por Lord Kelvin (William Thonson) e relatado numa carta de 1850 a Stokes. Este propôs o teorema como uma das questões de um concurso de matemática em 1854, o chamado Smith’s Prize Examination, e desde então, o teorema leva seu nome. Maxwell foi um dos vencedores do concurso [84]. Não há dúvida de que o teorema de Stokes exerceu profunda influência na magnífica obra de Maxwell [48]. Grosso modo, o teorema de Stokes diz o seguinte: Dados um campo vetorial f de classe C 1 e uma superfície S, aberta e orientada, com fronteira ∂S (Figura 2.57), a integral de superfície da componente normal do rotacional de f através de S é igual a integral de linha da componente tangencial de f ao longo da fronteira ∂S. O teorema de Stokes une integrais de linha e de superfície, tendo como elo de ligação o operador rotacional. ^n ^n
^n S ^ t
S ^ t
S
^t
S
S S
^n
^n
S
^t
^n
S
S ^t S
Figura 2.57: Superfícies de diferentes geometrias, limitadas por uma circunferência fixa de raio r. Um aspecto surpreendente do teorema de Stokes é o seguinte: uma vez 43 Lembre-se que o primeiro e segundo pilares mestres são a integral de linha (página 36) e a integral de superfície (página 53), respectivamente.
130
CAPÍTULO 2. CÁLCULO VETORIAL
fixada a fronteira de uma superfície aberta orientada, a forma geométrica da superfície é irrelevante à tese do teorema. A Figura 2.57 mostra pitorescamente cinco modelos diferentes de superfícies abertas, todas elas limitadas pelo mesmo tipo de borda, uma circunferência de raio r.fixo Metaforicamente, podemos imaginá-las como sendo superfícies elásticas, digamos de borracha, presas a um aro rígido e indeformável. Uma vez fixada a forma da borda, a tese do teorema de Stokes independe da geometria de qualquer uma das superfícies exibida na figura. Teorema 2.1 (Teorema de Stokes): Seja S uma superfície aberta no espaço R3 , orientada e suave por partes, e seja ∂S a sua fronteira, uma curva simples e suave por partes. Seja f (x, y, z) um campo vetorial contínuo que possui derivadas parciais de primeira ordem contínuas em uma região de R3 que contém S no seu interior. Então, Z Z (∇ × f ) · n ˆds = f ·ˆ tdl, (2.87) S
∂S
sendo n ˆ o campo de vetores unitários normais à S, e ˆ t, o campo de vetores 44 tangentes à curva ∂S . Prova:45 Seja S uma superfície como a do enunciado do teorema. Subdividindo-a em pequenas células retangulares46 , como ilustra a Figura 2.58a, é possível escrever a integral de linha, associada à n-ésima célula, da seguinte maneira: Z f ·ˆ tdln , Cn
em que Cn é o caminho que circunscreve a n-ésima célula, ou seja, a sua fronteira. Somando-se as integrais de linha de cada uma das células da partição da superfície e observando que elas se anulam mutualmente nas fronteiras entre células contíguas (Figura 2.58b), podemos, em virtude de Z
a
45
b
f ·ˆ tdln = −
Z
b
a
f ·ˆ tdln ,
Esta é uma prova simplificada, orientada para os nossos objetivos. O leitor interessado numa demonstração mais geral deve consultar a literatura [11], [19], [35], [70]. 46 No lugar de retângulos poder-se-ia usar outros tipos de polígonos. Triângulos, por exemplo, são muito convenientes. Ele se ajustam à superfícies complexas com mais facilidade que retângulos.
2.5. TEOREMAS DO CÁLCULO VETORIAL
131
^n ^t
(b)
(a)
Figura 2.58: (a) Subdivisão de uma superfície orientada por retângulos. (b) Zum de quatro retângulos contíguos. escrever
N Z X
n=1 Cn
f ·ˆ tdln =
Z
P
f ·ˆ tdln ,
em que P é a poligonal47 que contorna a fronteira ∂S da superfície S. Multiplicando e dividindo cada parcela do somatório do lado esquerdo desta identidade por ∆Sn , tem-se: ¸ Z Z N ∙ X 1 f ·ˆ tdln ∆Sn = f ·ˆ tdln . ∆S n C P n n=1
(2.88)
Fazendo-se o número de células crescer arbitrariamente, de modo que ∆Sn → 0, e em seguida, aplicando no lado esquerdo da exprssão (2.88) a definição de rotacional (2.25), podemos escrever ¸ Z Z N ∙ X 1 f ·ˆ tdln ∆Sn = (∇ × f ) · n ˆds. lim ∆Sn Cn N →∞ S n=1
∆Sn →0
Analogamente, quando ∆Sn → 0, a poligonal P tende para a fronteira ∂S, e por conseqüência, no limite, o lado direito de (2.88) se escreve: Z Z f ·ˆ tdln = f ·ˆ tdl, lim N →∞ ∆Sn →0
P
∂S
e assim, fica demonstrado o teorema ¥.48 47
Com a partição da superfície S por retângulos, a curva lisa que contorna a fronteira da superfície dá lugar a uma linha poligonal fechada P . 48 Este pequeno ícone ¥ indica o fim da demonstração do teorema.
132
CAPÍTULO 2. CÁLCULO VETORIAL
Em nenhum momento, nesta demonstração, a forma geométrica da superfície aberta foi levada em consideração. Isto deve-se ao fato das integrais de linha se cancelarem mutuamente na junção das células contíguas. Apenas as integrais de linha nas células situadas na fronteira da superfície não se anulam por completo. Observando o lado direito de (2.87) se conclui que o campo vetorial f se comporta como um campo de força, enquanto que ∇× f age como um campo de densidade de fluxo. Assim, o rotacional de um campo de força é um campo de fluxo. Lembre-se que o operador rotacional transforma campo vetorial em outro campo vetorial. Insisto em dizer que o primeiro é um campo de força e o segundo é um campo de densidade de fluxo, em virtude do teorema de Stokes. Esta separação de um campo vetorial em campo de força e campo de densidade de fluxo é fundamental para a compreensão do eletromagnetismo. Por exemplo, no SI, o campo elétrico E é um campo de força e o campo B é um campo de densidade de fluxo. É por isso que este último é denominado de densidade de fluxo magnético.Face à importância desta dicotomia em eletromagnetismo, voltaremos a estudá-la no próximo capítulo. O cálculo do teorema de Stokes com o Mathematica se resume em um simples exercício em que se aplicam as funções integralDeLinha[...], (página 38 ) e integralDeSuperfície[...], (página 60), estudadas detalhadamente nas subseções 2.3 1 e 2.3.2. Para usá-las precisamos ativá-las, portanto, In[1]:= (*--- integralDeLinha[...]
---*)
In[2]:= (*--- integralDeSuperficie[...]
---*)
Vejamos, agora, alguns exemplos: ¡ ¢ Exemplo 2.54: Dados o campo vetorial f = x2 yz, −xy3 z, xy2 z 2 e as quatro superfícies (abertas e orientadas): um disco, um hemisfério, um cone e um cilindro fechado na base, todas limitadas pela mesma circunferência x2 + y 2 = 1, vamos confirmar que o teorema de Stokes independe da forma da superfície em questão. Para iniciar, devemos implementar a parametrização de cada uma das quatro superfícies supracitadas. Então, In[3]:= (*--- Parametrização das quatro superficies. Clear[r, u, v]
---*)
2.5. TEOREMAS DO CÁLCULO VETORIAL
133
disco = {r Cos[u], r Sin[u], 1}; hemisfero = {Sin[u] Cos[v], Sin[u] Sin[v], 1 - Cos[u]}; cone = {v Cos[u], v Sin[u], v}; cilindro = {Cos[u], Sin[u], v}; baseCilindro = {r Cos[u], r Sin[u], 0};
Note que o cilindro fechado na base é uma superfície formada por duas partes. Assim, cada delas tem a sua própria parametrização. De posse das parametrizações é facil traçar os gráficos das quatro superfícies. Os gráficos do disco e do hemisfero estão ilustrados nas Figuras 2.59 (a) e ( b):
In[8]:= (*--- Figura 2.59:
(a) disco, (b) hemisfero ---*)
(a)
(b)
1.4 1.2 1 0.8 0.6
1 0.5 0
-1 -0.5
-0.5
0 0.5 1
-1
1 0.75 0.5 0.25 0 -1
1 0.5 0 -0.5
-0.5
0 0.5 1
-1
Figura 2.59: Superfícies abertas orientadas (a) disco, (b) hemisfero sul.
Os gráficos das outras duas superfícies: o cone e o cilindro fechado na base estão nas Figuras 2.60 (a) e (b):
In[12]:= (*--- Figura 2.60: base ---*)
(a) cone, (b) cilindro fechado na
134
CAPÍTULO 2. CÁLCULO VETORIAL (a)
(b)
1 0.75 0.5 0.25 0 -1
1 0.5 0 -0.5
-0.5
0 0.5 1
-1
1 0.75 0.5 0.25 0 -1
1 0.5 0 -0.5
-0.5
0 0.5 1
-1
Figura 2.60: Superfície aberta orientada: (a) cone, (b) cilindro fechado na base. Concluídas as figuras à guisa de curiosidade, vamos ao cálculo das integrais do teorema de Stokes. Primeiro, devemos efetuar a integral de linha (2.89) do campo f ao redor da circunferência x2 + y2 = 1 (parametrizada por α (u) = {cos u, sin u, 1}. Usando-se a função integralDeLinha[...], obtém-se o resultado −π/4. Com efeito: In[16]:= (*--- Calcula a integral de linha de ---*) Clear[x, y, z, u] {fx, fy, fz} = {x^2 y z, -x y^3 z, x y^2 z^2}; {x, y, z} = {Cos[u], Sin[u], 1}; integralDeLinha[x, y, z, u, fx, fy, fz, 0, 2 Pi] Out[19]:= −π/4
Agora devemos mostrar que a integral de superfície (2.87) da componente normal de ∇ × f também se iguala a −π/4, qualquer que seja a superfície entre as quatro fornecidas no problema. Para tanto, vamos usar a função integralDeSuperficie[...]. Mas antes, precisamos ativar o pacote Add-on Calculus‘VectorAnalysis‘ para acessar o comando Curl[...] que calcula o rotacional de um campo vetorial. Então: In[20]:= (*--- Ativa pacote Add On: Calculus‘VectorAnalysis‘ ---*) {”x”, ”ÿ”, ”z”}];
144
CAPÍTULO 2. CÁLCULO VETORIAL
1 0.5 0 -0.5 1-1
-2
0.5
-1 0
0
-0.5
1 2
-1
Figura 2.65: Superfície fechada e orientada de dentro para fora.
Feito o gráfico, vamos ao teorema de Gauss. Primeiro, computemos a integral do lado esquerdo de (2.89). Identificando-se a função ψ (x, y, z) em (2.23) com ∇· f e usando-se a parametrização da superfície, podemos escrever In[6]:= (*--- Ativa pacote Add On:
Calculus‘VectorAnalysis‘ ---*
$DisplayFunction];
2.5. TEOREMAS DO CÁLCULO VETORIAL
163
2
1
1
2
3
4
-1
-2
Figura 2.73: Região fechada em R2 ou superfície aberta em R3 limitadas por duas circunferências de raios 1 e 2, tangentes na origem.
Feito o gráfico da região, vamos, agora, calcular a integral do lado esquerdo de (2.99). In[23]:= (*--- Cálculo do lado esquerdo da equação (2.91 ---*) Clear[u, v] circulo1 = 2 Cos[v]; circulo2 = 4 Cos[v]; {x, y} = {u Cos[v], u Sin[v]}; jacobiano = Det[Outer[D, {x, y}, {u, v}]] // Simplify; Clear[x, y] {P, Q} = {(1 + x^3) y, 3 x (2 + y^3)}; polar = {x -> u Cos[v], y -> u Sin[v]}; green = D[Q, x] - D[P, y] /. polar; Integrate[Evaluate[green jacobiano], {v, -Pi/2, Pi/2}, {u, circulo1, circulo2}] Out[32]:= −157π/4
O cálculo da integral do lado direito de (2.99): In[33]:= (*--- Cálculo do lado direito da equação (2.91 ---*) Clear[u, v]
164
CAPÍTULO 2. CÁLCULO VETORIAL {P, Q} = {(1 + x^3) y, 3 x (2 + y^3)}; circulo1 = 2 Cos[v]; circulo2 = 4 Cos[v]; {x, y} = {circulo1 Cos[v], circulo1 Sin[v]}; integral1 = Integrate[Evaluate[P D[x, v] + Q D[y, v]], {v, Pi/2, -Pi/2}]; {x, y} = {circulo2 Cos[v], circulo2 Sin[v]}; integral2 = Integrate[Evaluate[P D[x, v] + Q D[y, v]], {v, -Pi/2, Pi/2}]; integral1 + integral2 Out[41]:= −157π/4
Para finalizar, vamos repetir os dois exemplos anteriores com os teoremas de Stokes e de Gauss, aplicados individualmente, ao invés do teorema de Green. Exemplo 2.65: Com os mesmos dados do exemplo anterior vamos calcular o lado esquerdo da fórmula 2.99 do teorema de Green usando duas vias diferentes: primeiro, pelo teorema de Stokes, segundo, pelo teorema de Gauss. Com o teorema de Stokes, vem: In[42]:= (*--- Ativa o pacote:
Calculus‘VectorAnalysis‘ ---*)
u Sin[v]}; stokes = Last[Curl[Append[{P, Q}, 0], Cartesian[x, y, z]]] /.
polar;
Integrate[Evaluate[stokes jacobiano], {v, -Pi/2, Pi/2},
2.5. TEOREMAS DO CÁLCULO VETORIAL
165
{u, circulo1, circulo2}] Out[52]:= −157π/4
Com o teorema de Gauss resulta: In[53]:= (*--- Calcula o lado esquerdo da equação (2.91) pelo teorema de Gauss. ---*) Clear[u, v] circulo1 = 2 Cos[v]; circulo2 = 4 Cos[v]; {x, y} = {u Cos[v], u Sin[v]}; jacobiano = Det[Outer[D, {x, y}, {u, v}]] // Simplify; Clear[x, y, z] {P, Q} = {(1 + x^3) y, 3 x (2 + y^3)}; polar = {x -> u Cos[v], y -> u Sin[v]}; gauss = Div[Append[{Q, -P}, 0], Cartesian[x, y, z]]] /. polar; Integrate[Evaluate[gauss jacobiano], {v, -Pi/2, Pi/2}, {u, circulo1, circulo2}] Out[62]: −157π/4
Os resultados Out[32], Out[41], Out[52] e Out[62] dispensam quaisquer cometários.
2.5.5
Teorema do Integrando Nulo
A proposição preste a ser apresentada é tão simples, tão elementar e tão corriqueira que não deveria ser considerada um teorema. E nem tão pouco mereceria um título. Mas, como se trata de uma proposição extremamente importante — imprescindível eu diria — em eletromagnetismo, atrevi-me dálhe um nome e elevar seu status de uma simples preposição ao posto honroso de teorema. Teorema 2.4 (Teorema do Integrando Nulo): Seja f uma função Rb contínua num intervalo fechado L e a f (x) dx = 0 para todo intervalo [a, b] ⊆ L. Então, f é uma função identicamente nula em L. Prova: Se f (x) fosse positiva para algum valor de x ∈ L, digamos x0 , e sendo contínua, ela seria positiva em algum intervalo contendo x0 , digamos,
166
CAPÍTULO 2. CÁLCULO VETORIAL
no intervalo (x0 + 1 , x0 + 2 ) . Então, fazendo-se a = x0 + 1 e b = x0 + 2 Rb a condição a f (x) dx = 0 seria violada Se, por outro lado, f (x) fosse negativa para algum valor de x, chegaríamos também a uma contradição. Resta portanto a possibilidade de f (x) ≡ 0 para todo valor de x. ¥ Uma conseqüência imediata do teorema do Integrando Nulo é a seguinte: Dadas as funções f e g, ambas satisfazendo as exigências do teorema e sabendo-se que Z
b
f (x) dx =
a
Z
b
g (x) dx para todo intervalo [a, b] , a
então f ≡ g em qualquer x do intervalo. Com efeito, basta observar que Z
a
b
[f (x) − g (x)] dx = 0, para todo intervalo [a, b] ,
e aplicar o teorema. O Teorema do Integrando Nulo pode ser facilmente generalizado para funções contínuas de R3 . Neste caso, uma função contínua definida numa região fechada V ⊂ R3 , que satisfaça a condição intransigente, Z f (x, y, z) dv = 0 para todo V ⊂ R3 , V
é identicamente nula em qualquer ponto (x, y, z) ∈ V .
2.6
Sumário
Vimos no primeiro capítulo que as equações de Maxwell, na forma integral, dependem de três tipos de integrais: integral de linha, integral de superfície e integral de volume. A primeira, se baseia no conceito de trabalho e se aplica a um campo de força (E, B/μ0 ou H), a segunda, prende-se ao conceito de fluxo através de uma superfície orientada (aberta ou fechada) de um campo do tipo densidade de fluxo (B, 0 E ou D) e finalmente, a terceira corresponde a integral de um campo escalar (densidade de carga elétrica, por exemplo) numa região limitada por uma superfície fechada e orientada. Para se entender a conceituação física do eletromagnetismo é imprescindível conhecer, de perto, a essência de cada uma dessas integrais. Por isso, grande parte deste segundo capítulo foi dedicada ao estudo pormenorizado de cada uma delas. Intuitivamente, integrais de linha e de superfície
2.6. SUMÁRIO
167
são muito próximas uma da outra. O cálculo de integrais de linha e de superfície é facilitado com a introdução da parametrização do domínio de integração (o caminho, no caso da integral de linha, e a superfície, no caso da integral de superfície) e do campo que se deseja integrar. No primeiro caso, a integral de linha se reduz a uma integral ordinária num intervalo da reta. No segundo caso, a integral de superfície se desfaz em uma integral dupla num retângulo do plano real. Isto tudo é feito de maneira muito simples com o Mathematica. Com efeito, basta se usar os procedimentos: integralDeLinha[...] (página 39) e integralDeSuperficie[...] (página 62). Antigamente (antes do advento dos computadores pessoais) o cálculo de integrais de linha e de superfície era quase sempre uma tarefa árdua e desinteressante. Hoje, com o auxílio do Mathematica, a computação de integrais de linha e de superfície é muito simples e até certo ponto divertida. No entanto, devemos ter em mente que o mais importante é compreender bem o significado físico dessas integrais e não, simplesmente saber como computá-las. Em eletromagnetismo é exatamente o significado físico o que mais importa, a computação, por sua vez, é um pequeno detalhe. Finalmente, o terceiro tipo de integrais, as chamadas integrais de volume, simplesmente totaliza o produto da densidade de um dado campo escalar (no nosso caso, densidade de carga elétrica) pelo volume que o contém. Uma vez realizada a parametrização do campo e da região, o cálculo de integrais de volume, via o Mathematica, é tão simples quanto o das integrais de linha e de superfície. Com efeito, basta usar o procedimento integralDeVolume[...] (página 77). Foi dito no primeiro capítulo que as equações de Maxwell na forma integral facilita entender os princípios básicos do eletromagnetismo. Embora a forma integral seja também útil para se resolver alguns problemas práticos de eletromagnetismo, ela não é, de todo, adequada para solucionar a maioria dos problemas eletromagnéticos ligados à tecnologia, estes geralmente na forma de equações diferencias. Para isso, introduzimos os operadores diferenciais: rotacional, divergência e gradiente. O primeiro se prende à integral de linha, o segundo à integral de superfície e o terceiro à integral de volume. Vimos que o operador rotacional transforma um campo de força em um campo de densidade de fluxo, o operador divergência transforma um campo de densidade de fluxo em um campo escalar e por fim o operador gradiente transforma um campo escalar num campo de força. Em seguida vimos os teoremas fundamentais do cálculo vetorial. O teorema de Stokes e o teorema de Gauss (da divergência) constituem o ponto central deste segundo capítulo. Grosso modo, a essência por trás destes teoremas é substituir, de uma certa maneira, o valor da integral numa região
168
CAPÍTULO 2. CÁLCULO VETORIAL
limitada (aberta ou fechada) pela integral na fronteira da região. Com efeito, o teorema de Stokes afirma que o fluxo normal do rotacional de um campo de força — transformado num campo de densidade de fluxo pelo operador rotacional — através de uma superfície aberta é contrabalançado pelo trabalho desse campo de força ao redor da fronteira da superfície aberta. Analogamente, o teorema de Gauss afirma que a divergência de um campo de densidade de fluxo — transformado num campo escalar pelo operador divergência — numa região fechada é igual ao fluxo normal que atravessa a superfície que limita esta região. Daí se conclui que a divergência de um campo de densidade de fluxo quantifica as fontes (ou sorvedouros) no interior de uma dada região do espaço. Por sua vez, o corolário do gradiente associa o gradiente de um campo escalar a um campo de força. A Tabela2.2 resume de forma esquemática a inter-relação entre os operadores (rotacional, divergência e gradiente), os teoremas (Stokes, Gauss e o corolário do gradiente) e os campos vetoriais (de força e de densidade de fluxo) e campos escalares. Esta tabela complementa a Tabela2.1 da página 80. Tabela 2.2: Operadores: Curl, Div e Grad Operador Teorema Campo Campo Curl Stokes de força =⇒ de densidade de fluxo Div Gauss de densidade de fluxo =⇒ escalar Grad Colorário do escalar =⇒ de força Gradiente Vimos também que o teorema de Green é um caso especial dos teoremas de Stokes de Gauss. Na verdade, existe uma teoria matemática belíssima (cálculo sobre variedades) que unifica todos esses teoremas em um só teorema, denominado de teorema de Stokes generalizado, também chamado teorema de Stokes — Gauss — Green — Ostrogradsky — fundamental do cálculo[70]. Veremos no quarto capítulo que a transformação das equações de Maxwell da forma integral para a forma diferencial se faz usando os teoremas de Stokes e de Gauss. Com isso, podemos dizer que o eletromagnetismo ajuda a entender o significado físico desses teoremas e vice-versa. Nos livros tradicionais de cálculo, os operadores gradiente, divergência e rotacional (nesta ordem) são introduzidos antes das integrais de linha, de superfície e de volume. Isto corresponde colocar o carro na frente dos bois. O mesmo acontece
2.7. EXERCÍCIOS
169
com os livros tradicionais de eletromagnetismo. Primeiro, as equações de Maxwell são apresentadas na forma diferencial e depois na forma integral. Acredito que é mais fácil compreender o significado físico desses objetos quando se troca a ordem de apresentação. Analisar os operadores rotacional, divergência e gradiente como caso limite das integrais de linha, de superfície e de volume, como foi feito aqui, é mais natural que introduzi-los de forma axiomática na ordem inversa. O mesmo acontece com as equações de Maxwell quando se inicia com a forma integral em vez da forma diferencial dada de modo axiomático. A propósito, foi a partir da forma integral que Maxwell desenvolveu originalmente sua teoria eletromagnética. Os teoremas de Stokes e de Gauss tiveram papel fundamental na conceituação do eletromagnetismo, como ele próprio afirma [48]. É bem verdade que por si só, os teoremas de Stokes e de Gauss não são suficientes para se transformar as equações de Maxwell da forma integral para a forma diferencial. É preciso ainda a interferência do teorema do Intervalo Nulo. Este é uma simples proposição matemática de vital importância em eletromagnetismo. Este teorema se aplica apenas a funções (campos) contínuas. Isto implica que a forma diferencial das equações de Maxwell só é válida para campos elétrico e magnético contínuos em regiões de propriedades elétricas também contínuas. As equações na forma integral não sofrem este tipo de restrição. Assim, nos pontos de descontinuidades deve-se usar um processo de limite da forma integral. O resultado deste processo produz as chamadas condições de fronteiras das componentes tangenciais e normais dos campos elétrico e magnético que junto com as equações de Maxwell, na forma diferencial, é tudo que se precisa para solucionar qualquer tipo de problema em eletromagnetismo. A partir do quarto capítulo teremos oportunidade de empregar esta metodologia para solucionar vários tipos de problemas interessantes. É só ter um pouco de paciência. Chegaremos lá!
2.7
Exercícios
1. A exemplo dos vetores de R3 , comente sobre a visualização geométrica dos vetores de R2 e de R. ˆ 2. Determine a componente de 2î +ˆ √j + 2k na direção da origem (0, 0, 0) ao ponto (1, −2, 3). Resposta: 3 14/7 3. Desenvolva manualmente o "determinante" da fórmula (2.7) e compare o resultado com a definição (2.5) do rotacional.
170
CAPÍTULO 2. CÁLCULO VETORIAL
4. Use o "determinante"da fórmula (2.7) e calcule o produto vetorial dos √ ¢ ¡ vetores 3, 1/5, 7 e (π, 4, 3/5) .Compare o resultado com Out[35] na página . 5. Dados os vetores a = (a1 , a2 , a3 ), b = (b1 , b2 , b3 ) e c = (c1 , c2 , c3 ) mostre que o produto triplo a· (b × c) é representado pelo determinante ¯ ¯ ¯ a1 a2 a3 ¯ ¯ ¯ a· (b × c) = ¯¯ b1 b2 b3 ¯¯ ¯ c1 c2 c3 ¯
6. Qual a interpretação geométrica do produto triplo do exercício anterior. ¡ ¢ ¡ ¢ 7. ¡Dados os vetores a¢= 3x2 y, yz 2 , −xz , b = xz, −y 2 , 2x2 z e c = 6x4 y 2 , 6x2 yz 2 , −yz calcule manualmente o produto triplo a· (b × c).
8. Repita o Exercício 7 usando o Mathemática.
9. Resolva manualmente a integral (2.13) do Exemplo 2.2. Resposta: −660.669. Observação: Procure resolver as integrais sem o uso de tabelas. É instrutivo calcular integrais deste tipo pelo menos uma vez na vida. Depois é só usar o Mathematica. 10. Substutíndo a quinta linha em In[3], na página 41, por {x, y, z} = {2.0 Sin[t], 3.0 Cos[t], t/3} e reptindo os cálculos, qual seria o resultado? ¢ ¡ ˆ o vetor posição de um ponto 11. Seja r = t2 + 2t î −3e−2tˆj +2 sin 5tk sobre um caminho parametrizado ¯ pelo¯ tempo t. Determine (a) dr/dt, (b) |dr/dt|, (c) d2 r/dt2 , (d) ¯d2 r/dt2 ¯ no ponto t = 0 e interprete √ ˆ (b) 2 35, (c) fisicamente os resultados. Resposta: (a) 2î + 6ˆj +10k, −12ˆj, (d) 12. ˆ ao longo do 12. Calcule o trabalho devido à força f = yî +2zˆj −3xk caminho formado pela interseção do plano z = x (z > 0) com o cilindro x2 + y 2 = 4; entre os pontos (0, −2, 0) e (0, 2, 0). 13. Calcule a integral de linha do campo vetorial xy
xy
ˆ f = y e î + x e ˆj +xyz k ao longo do caminho formado pela interseção do cone x2 +y 2 = (z − 1)2 com os três planos cartesianos, no primeiro octante. Por que o valor da integral não depende da orientação do caminho. Resposta: 0.
2.7. EXERCÍCIOS
171
14. Substitua o campo vetorial do Exemplo 2.5, página 47, pelo campo f
=
¡
¡ ¢ ¡ ¢5 ¢5 2x2 − y2 − z 2 / x2 + y 2 + z 2 2 î + 3xy/ x2 + y2 + z 2 2 ˆj ¢5 ¡ ˆ +3xz/ x2 + y2 + z 2 2 k
e refaça o exemplo. Interprete o resultado.
15. Sem usar o Mathematica, refaça o Exemplo 2.7 (página 63) do modo mais elementar possível. Analise e relate claramente cada um dos seus passos. ˆ 16. Calcule manualmente o fluxo do campo vetorial f = yî +zˆj + xk 2 2 através da superfície fechada limitada pelo o cilindro x + y = 9 e os planos z = x e z = 0 (z > 0). A orientação da superfície se faz de dentro para fora. Observação: É instrutivo tentar, pelo menos uma vez na vida, resolver integrais de superfície pelo método tradicional dos livros de cálculo. Isto ajuda a apreciar o poder extraordinário do Mathematica e, ao mesmo tempo, serve para alertar que não se deve usar um programa de computador de forma ingênua, como se fosse uma simples caixa preta. É preciso saber instruir o computador para que ele faça o trabalho computacional (braçal) de maneira inteligente e eficaz. 17. Agora sim, refaça o exercício anterior usando o Mathematica. 18. Complete detalhadamente todos os passos na determinação do rotacional em coordenadas cilíndrica (2.44) e em coordenadas esféricas (2.52). 19. Complete detalhadamente todos os passos na determinação da divergência em coordenadas cilíndrica (2.62) e em coordenadas esféricas (2.66). 20. Complete detalhadamente todos os passos na determinação do gradiente em coordenadas cilíndrica (2.77) e em coordenadas esféricas (2.78). 21. Se x = x (u, v), e y = y(u, v) prove que 1 ∂y ∂ (x, y) ∂v =− em que J = ∂x J ∂u ∂ (u, v)
172
CAPÍTULO 2. CÁLCULO VETORIAL
22. Se x = x (u, v), y = y(u, v), z = z(u, v) e F (x, y, z) = 0 prove que ∂ (z, x) ∂ (x, y) ∂ (y, z) dx + dy + dz = 0 ∂ (u, v) ∂ (u, v) ∂ (u, v) 23. Determine a divergência do campo vetorial f=
ψ (r) r r
em que r = krk é a distância da origem a um ponto (x, y, z) do espaço e ψ (r) é um campo escalar. Resposta: 2ψ (r) /r + ψ 0 (r). ˆ na 24. Calcule a integral de volume da divergência de f = yî + zˆj + xk 2 2 região limitada pelo cilindro x + y = 9 e os planos z = x e z = 0 (z > 0). Compare o resultado com o do Exercício 15 e tire suas conclusões. ˆ 25. Calcule o fluxo do campo f = (x − 2z)î + (x + 3y + z)ˆj + (5x + y) k través da superfície limitada pelo triângulo com vértices nos pontos (1, 0, 0), (0, 1, 0) e (0, 0, 1). O lado positivo é face visível do triângulo. Resposta: 5/3. 26. Soluções da equação de Laplace são denominadas de funções har¡ ¢−1/2 , U2 (ρ, θ, z) = mônica. Verifique se U1 (x, y, z) = x2 + y 2 + z 2 2 ρ cos 2θ e U3 (r, θ, φ) = r cos 2θ são funções harmônicas. Primeiro resolva manualmente e depois com o Mathematica. 27. Determine a equação de Poisson em coordenadas cilíndricas (2.84) e esféricas (2.85). 28. Verifique manualmente as identidades (2.86 - 2.86g). Repita o exercício usando o Mathematica. 29. Sejam P (x, y) e Q (x, y) funções contínuas com derivadas parciais também continuas numa região conexa R do plano. Mostre que uma condição necessária e suficiente para Z P dx + Qdy = 0, C
ao redor de qualquer curva fechada C contida em R é que ∂Q ∂P = , ∂y ∂x identicamente, em R.
2.7. EXERCÍCIOS
173
30. Mostre que as integrais de linha do campo vetorial f=
x −y î+ 2 ˆj x2 + y 2 x + y2
ao redor das circunferências x2 + y 2 − 1 = 0 e x2 + y 2 − 2x − 2y + 7 = 0 são iguais a 2π e 0, respectivamente. Este resultado parece contradizer o exercício anterior. O argumento é falso ou verdadeiro? 31. Na demonstração do Corolário do Gradiente foi dito que sendo c um vetor constante não nulo, a identidade Z Z b ) ds. c·∇U dv = c· (U n V
reduz-se a
∂V
Z
V
Justifique esta asserção
∇U dv =
Z
∂V
b ds. Un
32. Na demonstração do Corolário do Rotacional foi dito que sendo c um vetor constante não nulo, a identidade Z Z c· (∇ × f ) dv = c· (b n×f ) ds V
.reduz-se a
∂V
Z
V
∇ × f dv = −
Justifique esta asserção.
Z
∂V
f ×b nds.
33. Use o teorema de Green para calcular a integral de linha do campo vetorial ´i h ³ p p f = 1 + x2 + y2 î + y xy + ln x + 1 + x2 + y2 ˆj ao redor da circunferência x2 + y 2 = 4. Resposta: 4π
34. Justifique porque o Teorema Fundamental do Cálculo: Z b f 0 dx = f (b) − f (a) , a
em que f é um função C 1 (função contínua cuja derivada f 0 é também contínua), com f (a) e f (b) os valores da função na fronteira do intervalo fechado [a, b] pode ser interpretado como um caso particular do
174
CAPÍTULO 2. CÁLCULO VETORIAL teorema de Gauss. Seguindo o mesmo raciocínio, será que o Teorema Fundamental do Cálculo também seria um caso particular do teorema de Stokes, como acontece com o teorema de Green?
35. Use a identidade (2.86e) da página 126 e o teorema de Gauss para mostrar que Z Z Z ∂U ψds ∇ · (k∇U ) ψdv = k∇U ∇ψdv − k ∂n V V ∂V em que k, U e ψ são três campos escalares contínuos definidos na região fechada V ⊂ R3 e ∂U/∂n é a derivada normal à fronteira ∂V de V. 36. Use o resultado anterior para mostrar que µ ¶ µ ¶¸ Z ∙ ∂ ∂U ∂ ∂U k + k ψds ∂x ∂y ∂y S ∂x ¸ Z Z ∙ ∂U ∂ψ ∂U ∂ψ ∂U + ds − ψdl k k = ∂x ∂x ∂y ∂y S ∂S ∂n em que k, U e ψ são três campos escalares contínuos definidos na região fechada S ⊂ R2 e ∂U/∂n é a derivada de U na direção normal à fronteira ∂S de S. 37. Prove o resultado do exercício anterior usando o teorema de Green. 38. Aplique a identidade (2.86) da página 126 e o Corolário do Rotacional para mostrar que Z Z Z ∇×(k∇ × F) ψdv = k (∇ × F)×∇ψdv − kψ (∇ × F)× n ˆ ds, V
V
∂V
em que F é um campo vetorial contínuo; k e ψ são campos escalares ˆ é o vetor unitário contínuos, definidos na região fechada V ⊂ R3 e n normal à fronteira ∂V de V. 39. Partindo dos conceitos de campo de força e de campo de densidade de fluxo, faça a análise dimensional das equações de Maxwell (2.18 2.22) para verificar que, de fato, os campos E e H são do tipo campo de força, enquanto os campos B e D são do tipo campo de densidade de fluxo, no SI.
Capítulo 3
Transformar para simplificar 3.1
Série e Tranformada de Fourier
No primeiro capítulo, as duas últimas versões das equações de Maxwell foram apresentadas no domínio do tempo e no domínio da freqüência, respectivamente. No domínio da freqüência, a variação temporal das correntes e dos campos se faz de forma senoidal, conhecida também como variação harmônica. Uma vez fixada a freqüência, apenas duas informações são suficientes para caracterizar o sinal1 : amplitude e fase. Por outro lado, no domínio do tempo, a variação temporal se faz por pulsos de duração finita. Neste caso a caracterização do sinal é feita por um número infinito de valores durante a duração do pulso. Por isso, é mais conveniente trabalhar no domínio da freqüência que no domínio do tempo. O aparato matemático para se passar de um domínio para o outro são a transformada de Fourier e a ransformada de Laplace. Uma vez obtida a solução no domínio da freqüência, usa-se a transformada inversa de Fourier ou a transformada inversa de Laplace para se obter a resposta no domínio do tempo. A transformada de Fourier será estudada neste capítulo. A transformada de Laplace é introduzida na seção 7.9 e será de grande valia no décimo primeiro capítulo. A transformação de um sinal entre o domínio do tempo e o domínuio da freqüência é apenas uma das inúmeras aplicações da série e da transformada de Fourier em eletromagnetismo. Muitas outras aplicações virão no decorrer 1
A palavra sinal é um termo genérico muito empregado em eletromagnetismo. Ela se origina da engenharia de comunicações e significa uma grandeza eletromagnética (corrente, voltagem, campo elétrico, campo magnético, etc) dependente do tempo, portadora de alguma mensagem.
175
176
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR
do texto. Na verdade, a série e a transformada de Fourier são as ferramentas fundamentais em quase tudo que será abordo neste livro2 . Uma função real f (t) é dita periódica se f (t + T ) = f(t) para todo t ∈ R, sendo T um número real positivo. O menor valor de T é denominado de período da função periódica. As funções periódicas mais simples e certamente as mais importantes são: o seno e o co-seno, chamadas de função senoidal3 . A variável t representa o tempo ou qualquer outra quantidade, como por exemplo, distâncias ao longo das coordenadas cartesianas. Neste último caso pode-se usar as letras x, y ou z no lugar de t. Uma função y = f (t) periódica ou não é dita par se f (−t) = f (t), isto é, a função é simétrica com relação ao eixo y. A função é dita ímpar se f (−t) = −f (t), ou seja, a função é anti-simétrica com relação ao eixo y. A função cos t é par. A função sin t é ímpar. Veremos, logo mais, que uma função qualquer pode ser decomposta em duas componentes, uma par e outra ímpar. Veremos também que uma função periódica par pode ser decomposta em co-senos e uma função periódica ímpar em senos. Uma função periódica, com algumas poucas restrições4 , pode ser decomposta em senos e co-senos. Há várias maneiras de se introduzir a série de Fourier. Acredito que o modo mais simples e mais pedagógico, pelo menos para os iniciantes no assunto, é explorar intuitivamente a idéia básica por meio de gráficos. Este expediente facilita a compreensão da metodologia que está por trás da série e da transformada de Fourier. A subseqüente formulação matemática será uma simples extensão da imagem física (geométrica) apresentada pelos gráficos. Diz o dito popular que uma figura vale mais que mil palavras. Os matemáticos, por sua vez, advogam que uma equação vale mais que mil figuras. Talvez seja por isso que nos livros de análise de Fourier, a formulação matemática vem em primeiro lugar e os gráficos em seguida. Aqui, com a ajuda do Mathematica, decidimos trocar esta ordem ortodoxa. Iniciaremos 2 O cálculo vetorial estudado no segundo capítulo junto com a série e a transformada de Fourier deste capítulo formam a base para a generalização do conceito de vetor que será introduzida no sexto capítulo com os espaços vetoriais. 3 Uma função senoidal é definida por
f (t) = A sin (ωt + φ) , em que A, ω e φ são constantes reais, denominadas, respectivamente, de amplitude, freqüência angular e deslocamento de fase. O termo ωt + φ é conhecido como fase da função senoidal. A função cos ωt é uma função senoidal. Com efeito, basta fazer φ = π/2 na equação acima. Analogamente, fazendo-se φ = 0 a função sin ωt é obviamente uma função senoidal também. 4 Veja a nota de rodapé 14, na página 194.
3.1. SÉRIE E TRANFORMADA DE FOURIER
177
com alguns exemplos ilustrativos simples e a partir deles, introduziremos, a posteriori, a formulação matemática da série de Fourier. A representação gráfica servirá apenas de porta de entrada. A partir daí, tudo ficará por conta da análise matemática.
3.1.1
Série de Fourier
Para iniciar, analisaremos três exemplos: o primeiro contempla uma função par, o segundo uma função ímpar e o terceiro uma função nem par nem ímpar. Exemplo 3.1: Seja a função par e periódica de período 2π: f (t) = t2 , f (t + 2π) = f (t) .
− π < t ≤ π,
(3.1)
Vamos mostrar graficamente que esta função pode ser sintetizada em uma soma de co-senos do tipo:5 µ ¶ 1 1 1 1 π2 − 4 cos t − cos 2t + cos 3t − cos 4t + cos 5t − . . . f (t) ≈ 3 4 9 16 25 (3.2) em que cada termo co-seno da série é chamado de harmônico. O primeiro harmônico é denominado harmônico fundamental. Assim, cos t é o harmônico fundamental; cos 2t, o segundo harmônico; cos 3t, o terceiro harmônico e assim por diante. Note-se que a amplitude de cada harmônico em (3.2) é igual a (−1)n 4/n2 . Então, a amplitude do vigésimo harmônico será 1/100. Observe também que a freqüência angular6 de cada harmônico cresce linearmente com a ordem dos harmônicos. A Figure (3.1) serve de motivação para a nossa introdução à série de Fourier. Para iniciar, vamos traçar o gráfico da função f (t), cobrindo três períodos. Para isso, devemos codificar a função f (t) com o Mathematica, da seguinte maneira: In[1]:= (*--- Funcão periódica (3.1) ---*) Clear[t, f, funF] f[t_] = x^2; 5
Por enquanto, não se preocupe com esta fórmula. Tenha um pouco de paciência. Já, já, veremos como ela pode ser obtida. 6 Freqüência angular é o número de período por unidade de tempo e é expressa em radiano por segundo.
178
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR funF[t_]:= f[t] /; -Pi {FontSize -> 8.0}, PlotRange -> {xRange, yRange}, Ticks-> {xTicks, yTicks}, PlotStyle -> Dashing[{dash, dash}],
3.1. SÉRIE E TRANFORMADA DE FOURIER
179
PlotLabel -> StyleForm[txt], DisplayFunction -> Identity]
Empregando-se plotSerieDeFourier[...], os gráficos da Figura 3.1 são traçados com: In[3]:= (*--- Figura 3.1:
Aproximação de uma função par
por uma soma de co-senos ---*)
Na Figura 3.1, o gráfico (a) representa a função f (t); o gráfico (b) mostra os dois primeiros termos, π 2 /3 − 4 cos t, da soma (3.2) sobrepostos ao gráfico da função f (t); em (c), tem-se os gráficos da função o do segundo harmônico, cos 2t; em (d) o gráfico dos três primeiros termos, π 2 /3 − 4 cos t + cos 2t, sobreposto ao gráfico da função f (t); (e) aparece os gráficos da função e do terceiro harmônico, e finalmente em (f) o gráfico dos quatro primeiros termos sobreposto ao da função. Examinando estes gráficos, observa-se que com apenas três harmônicos já se tem uma razoável aproximação da função. Note que a amplitude de cada harmônico adicional vai decrescendo enquanto que a freqüência cresce gradativamente. Assim, os pequenos detalhes nos gráficos da função vão sendo preenchidos pelos harmônicos de ordem superior. Intuitivamente, podemos dizer que à medida que o número de harmônicos cresce, a aproximação da função, pela soma, torna-se cada vez mais perfeita. Exemplo 3.2: A função que acabamos de analisar é uma função periódica par. Agora, investigaremos uma função periódica ímpar. Seja, portanto, a seguinte função periódica de período 2π: ( −1, − π < t ≤ 0 f (t) = 1, 0 0, 1, -1]; funF[t_]:= f[t] /; -Pi {”t/T”, ”f(t)”}];
200
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR f(t) 1 0.8 0.6 0.4 0.2 t/T -1.5
-1
-0.5
0.5
1
1.5
Figura 3.7: Função Serra de período T . Foi dito acima que o cálculo dos harmônicos na forma exponencial é muito simples. Para constatar isto, vamos calculá-los manualmente, antes de se usar o Mathematica. Substituindo a função f (t) = t/T em (3.21), vem: 1 cn = T
Z
T
−inω0 t
f (t) e
0
1 dt = 2 T
Z
T
te−inω0 t dt.
0
Integrando por partes e sabendo-se que ω0 = 2π/T , resulta: ! à ¯T Z T te−inω0 t ¯¯ 1 1 −inω0 t + e dt cn = T2 −inω 0 ¯0 inω0 0 ∙ ¸ ¢ ¡ −i2πn 1 T e−i2πn 1 = − −1 . e T 2 −inω 0 (−inω0 )2
Como e−i2πn = cos(2πn) − i sin(2πn) = 1, ∀n ∈ Z, então os cn , com n 6= 0 se reduzem a i 1 = . cn = −inω0 T 2πn Para n = 0, usa-se o fato de c0 = a0 /2 e a fórmula ??. Logo: Z Z T /2 1 t/2 1 1 c0 = f (t) dt = 2 tdt = T −T /2 T −T /2 2
Substituindo esses valres de c0 e cn em (3.20), a série de Fourier da função Serra na forma exponencial, se escreve: f (t) =
∞ ∞ i X 1 −i4πnt i X 1 i4πnt 1 − e e + 2 2π n 2π n n=1
n=1
(3.22)
3.1. SÉRIE E TRANFORMADA DE FOURIER
201
Tudo isto pode ser feito com alguns simples comandos do Mathematica. Com efeito, fazendo, por exemplo, T = 1/2, a função periódica f (t) = t/T , 0 < t < 1/2, pode ser escrita, no intervalo −1/2 < t < 1/2, assim: In[84]:= (*--- Código da Função Serra ---*) Clear[t,funF] funSerra[t_]:= If[t {-1, -2}] // Expand Out[87]:= 1/2 − ie−4iπ t /(2π) + ie4iπ t /(2π) − ie−8iπ t /(4π) + ie8iπ t /(4π)− ie−12iπ t /(6π) + ie12iπ t /(6π) − ie−16iπ t /(8π) + ie16iπ t / (8π)
Note-se que os nove termos correspondem a N = 4 no procedimento FourierSeries[...], resultando em n = −4, −3, −2, −1, 0, 1, 2, 3, 4, de acordo com (3.21). A obtenção dos coeficientes de Fourier é igualmente simples. Por exemplo, para se ter os coeficientes de c−4 a c4 , basta teclar o comando: In[88]:= (*--- Coeficientes de Fourier da função Serra ---*) Table[FourierCoefficient[funSerra[t], t, n, FourierParameters -> {-1, -2}], {n, -4, 4}] // FullSimplify Out[89]= {−i/(8π), − i/(6π), − i/(4π), − i/(2π), 1/2, i/(2π), i/(4π), i/(6π), i/(8π) }
Há duas maneiras de representar graficamente uma função. A primeira é a forma tradicional de representação cartesiana que todos nos conhecemos desde a escola secundária. A segunda maneira, provavelmente desconhecida para a maioria dos leitores, é através da representação gráfica das componentes real e imaginária dos coeficientes da série de Fourier da função. Embora menos intuitiva, esta nova maneira é mais eficiente quando se deseja realçar alguns aspectos importante da função, principalmente quando trabalhamos com funções geradas com dados observados. Continuando com o exemplo da função Serra, vamos agora representá-la graficamente pelos seus coeficientes complexos de Fourier. Para traçar os gráficos vamos usar o seguinte precedimento: In[90]:= (*--- plotReImCn[...]
traça as componentes real e imaginária
202
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR Re(cn) 0.5
Im(cn) 0.2
0.4 0.1 0.3 0.2 -10 -8 -6 -4 -2
2
4
6
8
10
0.1 -0.1 -10 -8 -6 -4 -2
2
4
6
8
10 -0.2
-0.1
Figura 3.8: Representação gráfica dos coeficientes de Fourier da função Serra: (a) componente real, (b) componente imaginária. dos coeficientes de Fourier de uma funçao ---*)
Para se traçar os gráficos das componentes real e imaginária da série de Fourier da função Serra basta calcular os coeficientes e executar a função plotReImCn[...] em .In[90].Considerando os primeiros 21 coeficientes, temos: In[91]:= (*--- Figura 2.78: Gráficos das componente real e imaginária dos coeficientes da função Serra ---*) fourierCn[n_, T_]:= FourierCoefficient[funF[t], t, n, FourierParameters -> {-1, -2}]; plotReImCn[fourierCn, 10, 0.5, fourierCn];
Os valores absolutos dos coeficientes cn são denominados de espectro de amplitude da função periódica. O espectro de amplitude desempenha papel importantíssimo no estudo das séries de Fourier. A Figura 3.9 abaixo, ilustra o espectro de amplitude da função Serra do exemplo anterior. O gráfico da figura foi feito com a seguinte função plotAbsCn[...]: In[93]:= (*--- plotAbsCn[...] amplitude ---*)
traça o espectro de
Para se traçar o gráfico do espectro de amplitude da função Serra, basta gerar os coeficientes de Fourier e executar a função plotAbsCn[...] dada acima. Portanto: In[94]:= (*--- Figura 3.9:
Gráfico do espectro de amplitude da
3.1. SÉRIE E TRANFORMADA DE FOURIER
203
Abs(cn) 0.5
0.4
0.3
0.2
0.1
-10
-8
-6
-4
-2
2
4
6
8
10
-0.1
Figura 3.9: Espectro de amplitude da fun ção serra. função Serra ---*) Clear[t]u fourierCn[n_, T_]:= FourierCoefficient[funF[t], t, n, FourierParameters -> {-1, -2}]; plotAbsCn[10, 1./2, fourierCn];
Observa-se que os gráficos das Figuras 3.8 e 3.9 são formados por pontos discretos. Esta característica.vem do fato que os coeficientes de Fourier tomam valores em pontos discretos da reta devido ao caráter periódico da função. A relação entre periodicidade no domínio do tempo e discretização no domínio da freqüência é importantíssima na análise de Fourier. O próximo exemplo reforça ainda mais a idéia básica do relacionamento entre periodicidade de discretização. Exemplo 3.9: Calcular, traçar e seguinte função periódica: ⎧ ⎪ ⎨ 0 f (t) = 1 ⎪ ⎩ 0 f (t + T ) = f (t) ,
analisar o espectro de amplitude da − 12 T < t ≤ − 12 d, − 12 d < t ≤ 12 d, 1 1 2d < t ≤ 2T, sendo T > d
Esta função é uma seqüência periódica de pulsos retangulares de duração d > 0. Por isso, ela é cognominada de trem de pulsos retangulares.
204
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR 1.5 1 0.5 -6
-4
-2
2
4
6
2
4
6
2
4
6
1.5 1 0.5 -6
-4
-2 1.5 1 0.5
-6
-4
-2
Figura 3.10: Trens de pulsos retangulares em que T = 2d, 4d e 8d. Para entender a razão desta denominação vamos construir três gráficos correspondentes aos períodos: T = 2d, 4d e 8d. Para isso, usaremos a função pulsoRetangular[...]em In[97]: In[97]:= (*--- pulsoRetangular[...]
gera trens de pulsos
retangulares ---*)
Para se traçar os gráficos dos três trens de pulsos retangulares, basta executar In[106]:= (*--- Figura 3.10:
Gráficos dos três tens de
pulsos retangulares ---*) plotTremDePulsos[trem_]:= Module[{n}, ListPlot[trem, PlotJoined -> True, PlotRange -> {{-5, 6},{0, 1.5}}, Ticks -> {Table[n, {n,-5, 5}], {0, 0.5, 1, 1.5}}, TextStyle -> {FontSize -> 8.0}, AspectRatio -> Automatic, DisplayFunction -> Identity]]; Show[GraphicsArray[{{plotTremDePulsos[trem2d]}, {plotTremDePulsos[trem4d]}, {plotTremDePulsos[trem8d]}}], DisplayFunction -> $DisplayFunction];
É claro que na Figura ?? os pulsos retangulares se estendem indefinidamente para direita e para esquerda da página do livro. Por isso, os pulsos
3.1. SÉRIE E TRANFORMADA DE FOURIER
205
laterais do terceiro trem não aparecem na figura, entretanto eles existem fora da página. É só fechar os olhos e visualizá-los mentalmente como se fosse um trem de dimensão infinita vindo da esquerda para a direita. Em termos técnicos, diz-se que o trem de pulsos possuem simetria de translação. A esta altura, o razão do nome trem de pulsos é óbia e dispensa qualquer explicação. Vejemos como obter o espectro de amplitudo de um trem de pulsos retangulares. A partir de (3.21), pode-se escrever cn = =
Z
´ 1 ³ inω0 d/2 e e−inω0 t dt = − e−inω0 d/2 inω0 T −d/2 µ ¶ ω 0 nd 2 sin , nω 0 T 2 1 T
d/2
e assim, o especto de amplitude do trem de pulsos retangulares é dado por: ¯ ¡ ¢¯ ¯ d ¯sin nπd T , (3.23) |cn | = nπd T T em virtude de ω 0 = 2π/T . A tradução de (3.23) em linguagem do Mathematica se faz assim: In[108]:= (*--- absCn[n, d, T] calcula o espectro de f(t) ---*) absCn[n_, d_, T_]:= Module[{}, If[n == 0, d/T, d/T Abs[Sin[n Pi d/T]/(n Pi d/T)]]]
De posse da função absCn[...] estamos preparados para traçar os gráficos dos espectros de amplitude dos três trens de pulsos retangulares. Mais antes, devemos implementar a função plotEspectroDeAmplitude[...] que efetivamente constrói os gráficos: In[109]:= (*--- plotEspectroDeAmplitude[...] espectro de amplitude ---*)
traça gráficos de
Agora sim, estamos prontos para traçar os gráficos dos três trens de pulsos retangulares. Iniciando pelo primeiro trem de pulsos, com d = 1/20, T = 1/4, (Figura 3.11), vem: In[110]:= (*--- Figura 3.11:
Espectro de amplitude, d
= 1/20,
206
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR 0.2
0.15
0.1
0.05
-15
-13
-11
-9
-7
-5
-3
-1
1
3
5
7
9
11
13
15
Figura 3.11: Espectro de amplitude do trem de pulso com d = 1/20 e T = 1/4. T = 1/4 ---*) plotEspectroDeAmplitude[1/20, 1/4, 30, 4, .1]
Duplicando-se o período (d = 1/20, T = 1/2), o gráfico do espectro de amplitude do segundo trem de pulsos apresenta a seguinte forma (Figura 3.12): In[111]:= (*--- Figura 3.12: Espectro de amplitude, d T = 1/2 ---*) plotEspectroDeAmplitude[1/20, 1/2, 30, 4, .1]
= 1/20,
0.1
0.05
-30 -26 -22 -18 -14 -10 -6 -2
2
6
10 14 18 22 26 30
Figura 3.12: Espectro de amplitude do trem de pulso com d = 1/20 e T = 1/2.
.
3.1. SÉRIE E TRANFORMADA DE FOURIER
207
Finalmente, duplicando-se mais um vez o período (d = 1/20, T = 1), o gráfico do espectro de amplitude do terceiro trem de pulso torna-se (Figura 3.13): In[112]:= (*--- Figura 3.13:
Espectro de amplitude, d
= 1/20,
T = 1 ---*) plotEspectroDeAmplitude[1/20, 1, 60, 8, .,05]
Os gráficos dos espectros de amplitude nas Figuras 3.11, 3.12 e 3.13 se estendem indefinidamente para direita e para esquerda da página do livro, com descaimento monótono em ambos os lados. Note-se que a duplicação do período resulta na redução da amplitude pela metade. Em contra partida, o espectro torna-se duas vezes mais denso, embora continue discreto. Na verdade, qualquer que seja o período do trem de pulsos, o seu espectro de amplitude será sempre discreto. Em outras palavras, uma função periódica no domínio do tempo é transformada em uma função discreta17 no domínio da freqüência. A densidade de discretização é inversamente proporcional ao valor do período da função. 0.05
-60 -52 -44 -36 -28 -20 -12
-4
4
12
20
28
36
44
52
60
Figura 3.13: Espectro de amplitude do trem de pulso com d = 1/20 e T = 1.
. Um resultado muito importantes na análise de Fourier é a identidade de Parseval : Z ∞ X 1 T /2 2 |f (t)| dt = |cn |2 . (3.24) T −T /2 n=−∞ 17
Uma função discreta é uma função definida em pontos isolados (inteiros) da reta.
208
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR
A integral do lado esquerdo de (3.24) é conhecida como conteúdo de potência da função periódica f (t) A identidade de Parseval simplesmente afirma que o conteúdo de potência de uma função periódica f (t) é invariante quando se passa do domínio do tempo para o da freqüência [31]. Voltando aos três trens de pulsos retangulares do Exemplo 3.9, vamos calcular o conteúdo de potência de cada um deles. A primeira providência é implementar no Mathematica a identidade de Parseval (3.24) relacionada a um trem de pulso. Isto é feito da seguinte maneira: Codificação do lado esquerdo de (3.24): In[113]:= (*--- parsevalE[...] calcula o lado esquerdo da identidade de Parseval. ---*) parsevalT[d_, T_] := Module[{}, (1/T) Integrate[1, {t, -d/2, d/2}]]
Codificação do lado direito de (3.24): In[114]:= (*--- parsevalD[...] calcula o lado direito da dentidade de Parseval. ---*) parsevalF[d_, T_] := Module[{pidT = Pi d/T}, Re[(d/T)^2 (Sum[(Sin[n pidT]/(n pidT))^2, {n, -Infinity, -1}] + 1. + Sum[(Sin[n pidT]/(n pidT))^2, {n, 1, Infinity}])]]
Agora, com as funções parsevalE[...] e parsevalD[...], podemos computar o conteúdo de potência do primeiro trem de pulsos retangulares em que d = 1/20 e t = 1/4: In[114]:= (*--- Conteúdo de potência do primeiro trem de pulsos retangulares (d = 1/20, T = 1/4) ---*) d = 1/20, T = 1/4}; {N[parsevalE[d, T]], parsevalD[d, T]} Out[116]= {0.2, 0.2}
Como deve ser, os valores do conteúdo de potência do lado direito e esquerdo são idênticos e iguais a 0.2. Agora o segundo trem de pulsos em que d = 1/20 e t = 1/2: In[117]:= (*--- Conteúdo de potência do segundo trem de pulsos retangulares (d = 1/20, T = 1/2) ---*)
3.1. SÉRIE E TRANFORMADA DE FOURIER
209
d = 1/20, T = 1/2}; {N[parsevalE[d, T]], parsevalD[d, T]} Out[118]= {0.1, 0.1}
E finalmente, o terceiro trem de pulsos em que d = 1/20 e t = 1: In[119]:= (*--- Conteúdo de potência do terceiro trem de pulsos retangulares (d = 1/20, T = 1) ---*) d = 1/20, T = 1}; {N[parsevalE[d, T]], parsevalD[d, T]} Out[120]= {0.05, 0.05}
Observe que à medida que o período do trem de pulsos é duplicado, o conteúdo de potência se reduz à metade.
3.1.2
Transformada de Fourier
O exemplo que acabamos de ver serve de motivação para responder a questão feita na página 195 de como empregar a metodologia da série de Fourier a funções aperiódicas em R. De fato, suponhamos que o valor do período do trem de pulsos cresça indefinidamente, de tal modo que no final se tenha uma função aperiódica na reta, constituída apenas pelo pulso central cercado simetricamente por um contínuo indenticamente nulo nos dois lados do pulso. Acompanhando a tendência dos espectros de amplitude mostrados nas Figuras (3.11), (3.12) e (3.13), pode-se conjecturar que à medida que a função se torna aperiódica, o seu espectro de amplitude torna-se cada vez mais denso, aproximando-se de uma função contínua. Ademais, à medida que a duração d do pulso aumenta, a amplitude máxima do espectro de amplitude também cresce, concentrando-se, cada vez mais, na origem. O nosso próximo passo é reformular esta idéia heurística numa linguagem simbólica que servirá de motivação para a definição da transformada de Fourier. Assim, substituindo (3.21) em (3.20) e levando-se em consideração que ω 0 = 2π/T , podemos escrever # " Z ∞ T /2 X 1 f (t) = f (τ ) e−inω0 τ dτ ω 0 einω0 t . (3.25) 2π −T /2 n=−∞ O uso da variável de integração τ na integral interna serve para distinguir da variável t na integral externa.
210
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR
Fazendo T crescer arbitrariamente, pode-se adiantar, em virtude de ω 0 = 2π/T, que a freqüência fundamental ω0 torna-se infinitamente pequena. Renomeando este valor pequeno de ω0 por ∆ω, a freqüência nω0 de qualquer harmônico tende para a variável contínua ω, a medida que n cresce. Ou seja, quando n → ∞ e ∆ω → 0, o produto, nω 0 = n∆ω → ω se mantém finito. Procedendo o limite T → ∞ e ∆ω → dω, podemos reescrever (3.25) da seguinte maneira: ¸ Z ∞ ∙Z ∞ 1 −iωτ f (τ ) e dτ eiωτ dω, (3.26) f (t) = 2π −∞ −∞ em que o somatório se converte em uma integração na variável ω. A esta altura, a função f (t) já é totalmente aperiódica. Se extrairmos a integral interna de 3.26 e renomeá-la assim: Z ∞ b f (t) e−iωt dt, f (ω) = −∞
a integral (3.26) torna-se:
f (t) =
1 2π
Z
∞
−∞
fb(ω) eiωτ dω.
Pode-se dizer que estas duas últimas integrais são para funções aperiódicas na reta o que a série de Fourier é para funções periódica. Grosso modo, podemos imaginar que a última integral representaria a função f (t) como uma ”soma continua” de harmônicos, enquanto que a primeira integral fornece os ”coeficientes”.destes harmônicos. Estas idéias heurísticas servem de base para a definição axiomática da transformada de Fourier de uma função f (t). Então vejamos: Data uma função f (t), t ∈ R, tomando valores reais ou complexos, a sua transformada de Fourier F [f (t)] é definida pela integral: Z ∞ ˆ F [f (t)] = f (ω) = f (t) e−iωt dt. (3.27) −∞
Da mesmo modo, define-se aioperação inversa, ou seja, a transformada h −1 b inversa de Fourier F f (ω) , por meio da integral: −1
F
Z ∞ h i 1 ˆ f (ω) = f (t) = fˆ (ω) eiωt dω. 2π −∞
(3.28)
3.1. SÉRIE E TRANFORMADA DE FOURIER
211
A condição da existência de fˆ (ω) depende da função f (t) ser absolutamente integrável, isto é, Z ∞ |f (t)| dt < ∞. −∞
Esta definição da transformada de Fourier que acabamos de apresentar é a que, normalmente, se encontra nos livros de matemática ([73], [31]) Mas, é preciso muito cuidado, pois em muitos livros de Física, de Engenharia Elétrica e até de Geofísica, a integral (3.28) é tida como a transformada direta, enquanto que a integral (3.27) é considerada a transformada inversa. Em outras palavras, a ordem das duas integrais é invertida com relação à definição aqui apresentada. O Mathematica, por exemplo, adota esta segunda convenção, [85]. Ademais, ainda há um outro problema. Não há consenso, na literatura, em qual das duas integrais deve constar a constante 1/2π. Muitos preferem distribuí-la igualmente entre as duas integrais, ou √ seja, 1/ 2π para cada uma delas ([47], [56]). O Mathematica adota, como padrão, esta última alternativa, embora ofereça opções para todas as outras possibilidades, conforme as seguintes fórmulas gerais das transformadas direta e inversa de Fourier: s Z ∞ |b| b f (t) eibωt dt. f (ω) = (2π)1−a −∞ f (t) =
s
|b| (2π)1+a
Z
∞
−∞
fb(ω) e−ibωt dω.
O Mathematica convenciona como padrão (default) a = 0 e b = 1. Por outro lado, as integrais (3.27) e (3.28) na nossa definição demandam a = 1 e b = −1. Com isso, devemos usar o comando FourierParameters -> {1,-1} para fazer a conversão quando usarmos o Mathematica 18 . A transformada de Fourier de um campo vetorial f = (fx , fy , fz ) é um outro campo vetorial cujas componentes são as transformadas de Fourier das componentes de f . Ou seja, a transformada de Fourier de um campo 18
A não uniformidade na definição da transformada de Fourier não cria absolutamente nenhum problema porque o resulto final será sempre o mesmo depois de feita a transformada direta e inversa. O que se perde na ida ganha-se na volta. O importante é ser consistente, usar sempre as duas integrais do mesmo par, seja ele qual for. As aplicações da transformada de Fourier são muito amplas em ciência e tecnologia, assim, muitas vezes é mais conveniente se usar um determinado par que melhor se ajusta ao problema a ser resolvido.
212
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR
vetorial f é igual a transformada de Fourier de cada uma das componenbtes do campo. Simbolicamente, ´ F [f (t)] = (F [fx (t)] , F [fy (t)] , F [fz (t)]) ou sim³ b b b b plesmente, f = fx , fy , fz . Tal como na série de Fourier, o cálculo da transformada de Fourier com o Mathematica é extremamente simples. Vejamos, então, alguns exemplos.
¡ ¢ Exemplo 3.10: Dada a função 1/ a2 + t2 , calcular a transformada de Fourier e em seguida obter a transformada inversa. Primeiro, a trasformada direta: In[1]:= (*--- Transformada de Fourier da função 1/(a^2 + t^2) ---*) Clear[a, t, w] FourierTransform[1/(a^2 + t^2), t, w, FourierParameters -> {1,-1}] √ a2 Abs[w]
Out[2]= e−
√ a2
π/
Agora, a transformada inversa: In[3]:= (*--- Transformada de Fourier da função 1/(a^2 + t^2) ---*) InverseFourierTransform[%, w, t, FourierParameters -> {1,-1}] √ Out[3]= a/((a2 + t2 ) a2 )
Note-se que a transformada inversa reconstitui a função original. Exemplo 3.11: Calcular a transformada de Fourier da função e−a|t| e em seguida efatuar a transformada inversa. A transformada direta: In[4]:= (*--- Transformada de Fourier da função Exp[-a Abs[t]] ---*) Clear[a, t, w] FourierTransform[E^(-a Abs[t]), t, w, FourierParameters -> {1,-1}] Out[5]= 2 a/(a2 + w2 )
3.1. SÉRIE E TRANFORMADA DE FOURIER
213
E a transformada inversa: In[6]:= (*--- Transformada de Fourier da função Exp[-a Abs[t]] ---*) InverseFourierTransform[%, w, t, FourierParameters -> {1,-1}] √ a2 Abs[t]
Out[6]= a e−
√ a2
/
Estes resultados dispensam qualquer comentário. Dando prosseguimento, seguem algumas propriedades importantes da transformada de Fourier as quais serão muito úteis mais adiante. Sejam as funções f (t) e g (t) e suas transformadas de Fourier F [f (t)] = fˆ e F [g (t)] = gˆ • É fácil verificar que dadas as constantes α e β, tem-se: F [αf (t) + βg (t)] = αfˆ (ω) + βˆ g (ω) , e F [f (αt)] =
1 ˆ³ ω ´ f . |α| α
(3.29)
(3.30)
• Data uma constante real τ , verifica-se que: F [f (t − τ )] = fˆ (ω) e−iωτ . • Dada a constante ω0 , constata-se que: ¤ £ F f (t) e−iω0 τ = fˆ (ω − ω 0 ) .
• Derivando (3.28) em relação a t, resulta: Z ∞ df 1 = iωfˆ (ω) eiωt dω. dt 2π −∞
(3.31)
(3.32)
(3.33)
A propriedade (3.29) afirma que a transformada de Fourier é um operador linear. As propriedades (3.31) e (3.32) são denominada, respectivamente, de propriedades de deslocamento no tempo (time-shifting property) e delocamento na freqüência (frequency-shifting property). Todas estas propriedades são muito importantes. Todavia, a última relação, (3.33), é, sem dúvida, a mais importante de todas. Por isso, vale a pena destacá-la aqui.
214
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR
Seja f uma função real ou complexa de variável real t e fb(ω) a sua transfornada de Fourier, então, ∙ ¸ df = iω fb(ω) . (3.34) F dt Iterando (3.28), tem-se ¸ ∙ n d f (t) = (iω)n fb(ω) , F dtn
n = 1, 2, 3...
(3.35)
Uma maneira figurativa de interpretar a propriedade (3.34) é imaginar que a transformada de Fourier tem o poder mágico de dissolver derivadas! Este ardil da transformada de Fourier é de grande valia em matemática e obviamente em eletromagnetismo também. Isto será comprovado inúmeras vezes no decorrer do livro. Intuitivamente, podemos dizer que a transformada de Fourier é uma ferramenta que converte equações diferenciais (equações que envolvem d/dt) em simples equações algébricas (equações em iω). Uma vez resolvida a equação algébrica, obtém-se a solução da equação diferencial original por meio da transformada inversa de Fourier. Dito de outra maneira, a transformada de Fourier é uma ferramenta que converte um problema de equações diferenciais, geralmente difícil de ser solucionado, em um outro problema mais simples de ser resolvido. Tendo solucionado o problema no domínio da freqüência é muito fácil obter a solução do problema original, no domínio do tempo, por meio da transformada inversa de Fourier.19 . Daí o título deste capítulo. Transformar para simplificar. 19
Esta estratégia de converter um problema trabalhoso em um outro mais simples, por meio de transformadas, é um expediente muito comum em matemática, embora, muitas vezes, nós não percebemos disto. O logaritmo estudado na escola secundária é um bom exemplo. De fato antes de surgirem as máquinas de calcular (ábacos, réguas de cálculo, calculadoras mecânicas e eletrônicas e computadores), era muito trabalhoso multiplicar, na mão, dois números grandes, digamos, 234567234 e 903658001. Os logaritmos foram inventados pelos astrônomos da idade média, exatamente, para contornar este problema. Como se sabe, os astrônomos lidam com números ”astronômicos”. Usando-se a propriedade que diz que o logaritmo do produto de dois números é a soma dos seus logaritmos, podemos escrever log (234567234 × 903658001) = log (234567234) + log (903658001), ou seja log (234567234 × 903658001) = 8.370267346710339 + 8.956004098195466 = 17.326271444905805. Efetuando, o inverso do logaritmo, isto é, 1017.326271444905805 resulta em 211968557776539234, que é exatamente o produto dos dois números dados acima. Note que o logaritmo permite transformar o problema trabalhoso
3.1. SÉRIE E TRANFORMADA DE FOURIER
215
Finalmente, uma propriedade muito útil da transformada de Fourier é a chamada propriedade de simetria, a qual pode ser traduzida nos seguintes b termos. hDadas i a função f (t) e a sua tranformada de Fourier f (ω) = F [f (t)], então F fb(t) = 2πf (−ω). A verificação desta propriedade é muito simples. Com efeito, trocando-se t por −t em (3.27), Z ∞ fb(ω) e−iωt dω. 2πf (−t) = −∞
e permutando t por ω
2πf (−ω) =
Z
∞
−∞
e consequentemente,
3.1.3
Convolução
fb(t) e−iωt dt,.
h i 2πf (−ω) = F fb(t)
(3.36)
Vimos acima que a transformada de Fourier da soma de duas funções é igual à transformada da soma. E a transformada do produto de duas funções? Será que ela é igual à transformada do produto? A resposta é um categórico não. Então, qual seria a transformada de Fourier do produto de duas funções em termos das transformadas de cada uma delas? Analogamente, qual seria a transformada inversa do produto das transformadas de Fourier de duas funções? Para responder a estas duas questões, precisamos discorrer sobre um assunto central da análise de Fourier. Trata-se do conceito de convolução de duas funções, coceito este importantíssimo em geofísica 20 e em eletromagnetismo, também. da multiplicação por uma simples soma no domínio do logaritmo. A transformada inversa, para o domínio da multiplicação, é realizada pelo antilogaritmo, ou seja, pela exponencial de base 10. Durante séculos os logaritmos foram usados com este propósito. Inúmeras tábuas de logaritmos foram desenvolvidas por matemáticos e astrônomos para facilitar o manuseio com os logaritmos. Com estas tábuas, a tarefa de multiplicar dois números ”astronômicos” se reduzia em consultar nas tábuas os logaritmos dos dois números, somá-los e procurar, de volta, o antilogaritmo. Além das transformadas de Fourier teremos oportunidade, no decorrer do livro, de trabalhar com outros tipos de transformadas (de Laplace, de Hankel, de LebedevKantorovich, de Hilbert, entre outras), todas elas terão o mesmo propósito: reduzir um problema em que a solução é geralmente muito difícil de ser obtida, ou até mesmo inacessível, a um outro problema mais simples de ser resolvido. 20 Segundo a SEG (Society of Exploration Geophysicists) 95% dos geofísicos no mundo trabalham na indústria de petróleo. Destes, 90% processam diariamente dados sísmicos
216
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR
Como a convolução de duas funções é uma operação sutil, principalmente para os iniciantes, vamos apresentá-la por meio de gráficos, como fizemos antes com a série de Fourier. É aquela velha história, uma figura vale por mil palavras. Eu já disse isto antes. Pois bem, uma vez entendida a representação gráfica, será mais fácil acompanhar o significado físico e a definição matemática formal de convolução que será apresentada logo em seguida a apresentação dos gráficos. Sejam f (t) um pulso exponencial e g (t) um pulso retangular definidos da seguinte maneira: ( 0 t 0 e ⎧ 0 t Identity], Plot[pulsoExponencial[t], {t, -6, 6}, PlotLabel -> ” g(t)”, DisplayFunction -> Identity]}], usando as operações de convolução e deconvolução (operação inversa da convolução). Com isso, podemos dizer jocosamente que quando enchemos o tanque de gasolina dos nossos carros, estamos virtualmente ”pingando” algumas ”gotas” de convolução junto com a gasolina.
3.1. SÉRIE E TRANFORMADA DE FOURIER f(t) 1
-6
-4
-2
217 g(t) 1
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2 2
4
6
-6
-4
-2
2
4
6
Figura 3.14: Representação gráfica do pulso exponencial f (t) e do pulso retangular g (t), centrado em t = 1. DisplayFunction -> $DisplayFunction];
Agora, para acompanhar graficamente o processo de convolução de f (t) e g (t) vamos seguir os seguintes passos. O gráfico da função g (t) é mantido fixo e o da função f (t) é deslocado gradativamente da seguinte maneira: Gira-se o gráfico de f (t) em torno do eixo t para se obter f (−t). Em seguida, translada-se o gráfico de f (−t) um pouco para esquerda, isto é, f (τ − t) com τ < 0. A partir dai, vai-se gradativamente aumentando o valor de τ fazendo-se com que o gráfico de f (τ − t) se desloque continuamente da esquerda para a direita. À medida que isto é feito, calcula-se o produto f (τ − t) g (t) e determina-se o valor da área sobre o gráfico deste produto. A área assim obtida varia continuamente com τ . Isto significa que para cada valor do deslocamento τ associa-se o valor da área obre o gráfico do produto f (τ − t) g (t). Este processo resulta numa função h (τ ) denominada de convolução das funções f (t) e g (t), simbolizada por h(τ ) = f (τ )∗g(τ ) 21 . Este esquema, difícil de ser explicado em palavras, é fácil de ser visualizado graficamente. Por isso, vamos repetir, passo a passo, por meio de gráficos, o que acabamos de escrever. Depois de entender a apresentação gráfica volte e releia este parágrafo novamente que se convecer que o conceito de convolução não tem mistério nenhum. Para traçar os gráficos de f (t), g (t) e h (t) = f (t) ∗ g (t) vamos escrever duas rotinas de plotagem: uma, denominada de plotPulsoEpulsoR[...] 21
A rigor, deveríamos escrever h (t) = f (t) ∗ g (t) ao invés de h (τ ) = f (τ ) ∗ g (τ ). Mas, o emprego, aqui, da letra τ para representar a variável tempo, facilita a compreensão do conceito de convolução. De qualquer maneira, esta é uma questão apenas de simbologia, assim, usaremos uma ou outra letra indistintamente.
218
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR
para os gráficos de f (t) e g (t) e a outra, chamada de plotConvol[...], para construir o gráfico da convolução h (t) = f (t) ∗ g (t). Então, vejamos, In[4]:= (*--- plotPulsoRpulsoE[...]:
constrói os graficos dos
pulsos exponencial e retangular ---*) plotPulsoEpulsoR[t1_]:= Show[Plot[{pulsoRetangular[t2], pulsoExponencial[t1 - t2]}, {t2, -6.2, 6.2}, PlotRange -> {{-6.2, 6.2}, {0, 1}}, Ticks -> {Automatic,{0, 0.5, 1}}, TextStyle -> {FontSize -> 8.0}, DisplayFunction -> Identity], If[t1 < 2, maxT = t1, maxT = 2]; Table[Graphics[Line[{{t2, 0}, {t2, Exp[t2 - t1]}}]], {t2, 0, maxT, 0.01}]];
e In[5]:= (*--- plotConvol[...]:
constrói o grafico de
h(t) = f(t)*g(t) ---*) plotConvol[n_, listConvH_]:= Show[ListPlot[Take[listConvH,2 n], PlotStyle -> PointSize[0.03], PlotRange -> {{-6.2, 6.2}, {-0.04, 1}}, Ticks -> {{-6, -4, -2, 0, 2, 4, 6},{0, 0.5, 1}}, TextStyle -> {FontSize -> 8.0}, DisplayFunction -> Identity], ListPlot[Take[listConvH, 2 n], PlotJoined -> True, DisplayFunction -> Identity]]
De posse dessas duas procedimentos de plotagem, vamos traçar os gráficos de f (t) e de g (τ − t) realçando a área sobre o gráfico do produto das duas funções. Para esboçar h (t) = f (t)∗g (t). vamos usar os valores da lista listFunH dada a seguir. Mais adiante, veremos como esses valores foram calculados. Pois bem, comecemos, então, aos gráficos:. In[6]:= (*--- Lista dos valores de h(t) = f(t)*g(t) ---*) listConvH = {{-0.5, 0}, {0, 0}, {0.5, 0.393469}, {1, 0.632121}, {1.5, 0.777687}, {2, 0.864665}, {2.5, 0.524446}, {3, 0.318092}, {3.5, 0.192933}, {4, 0.11702}, {4.5, 0.070976}, {5, 0.0430491}, {5.5, 0.0261106}, {6, 0.0158369}};
3.1. SÉRIE E TRANFORMADA DE FOURIER In[7]:= (*--- Figura 3.15:
219
Convolução gráfica dos pulsos retangular e
exponencial ---*) Show[GraphicsArray[Table[ {plotPulsoRpulsoE[n - 3/2], plotPulsoRpulsoE[n - 1], plotConvol[n, listConvH]}, {n, 7}]],
DisplatFuction -> $DisplayFunction]; A Figura 4.18 contém sete linhas e três colunas de gráficos. Estes gráficos, em seqüência, traduzem o processo de convolução relatado acima verbalmente. Agora vamos analisar os gráficos. O primeiro gráfico (1, 1)22 , mostra f (τ − t) à esquerda da função fixa g (t) para um valor pequeno de τ < 0. O segundo gráfico, (1, 2), é uma réplica do primeiro gráfico, apenas transladado para a direita em que τ = 0. Nestes dois gráficos, as funções f (τ − t) e g(t) não se interceptam e portanto, a área do produto entre ela é nula em ambos os casos. Estes valores nulos das áreas estão representados no gráfico (1, 3) por dois pontinhos pretos. Os gráficos (2, 1) e (2, 2) mostram as áreas dos produtos de f (τ − t) e g(t) para dois valores positivos distintos de τ . Os pontos no gráfico (2, 3) indicam os valores correspondentes a estas áreas. Da segunda linha em diante este mesmo processo se repete com valores de τ sempre crescentes. Assim, observando-se os gráficos da terceira coluna nota-se que à medida que f (τ − t) faz o seu percurso de transladação da esquerda para a direita, a área sob o produto das duas funções, f (τ − t) e g(t), cresce, para depois diminuir de forma assintótica. Os gráficos da terceira coluna representam, precisamente, a convolução h (τ ) = f (t) ∗ g (t). Há várias maneiras de se interpretar fisicamente a operação de convolução. Uma das mais popular é a que caracteriza a entrada e saída de um sistema linear invariante no tempo23 , conhecido, na praça, como ”caixa 22
Gráfico (n, m) significa o gráfico da n-ésima linha e m-ésima coluna. Neste caso particular, primeira linha e primeira coluna. 23 Um sistema é dito linear se satisfaz a seguinte condição: o sinal de entrada, fi (t) = αfi1 (t) + βfi2 (t) , produz o sinal de saída, fo (t) = αfo1 (t) + βfo2 (t) , em que fo1 (t) e fo2 (t) são as componentes de saída correspondentes, respectivamente, às componentes de entrada fi1 (t) e fi2 (t). Um sistema linear é dito invariante no tempo se dados os sinais de entrada fi (t) e de saída fo (t) se verifica que o sinal de entrada fi (t + τ ) produz o sinal de saída fo (t + τ ), para qualquer τ . Isto significa que as funções de entrada e saída são funções do tempo, mas, as funções em si independem do tempo.
220
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR
1
1
1
0.5
0.5
0.5
-6 -4 -2
2
4
6
-6 -4 -2
2
4
6
-6 -4 -2
1
1
1
0.5
0.5
0.5
-6 -4 -2
2
4
6
-6 -4 -2
2
4
6
-6 -4 -2
1
1
1
0.5
0.5
0.5
-6 -4 -2
2
4
6
-6 -4 -2
2
4
6
-6 -4 -2
1
1
1
0.5
0.5
0.5
-6 -4 -2
2
4
6
-6 -4 -2
2
4
6
-6 -4 -2
1
1
1
0.5
0.5
0.5
-6 -4 -2
2
4
6
-6 -4 -2
2
4
6
-6 -4 -2
1
1
1
0.5
0.5
0.5
-6 -4 -2
2
4
6
-6 -4 -2
2
4
6
-6 -4 -2
1
1
1
0.5
0.5
0.5
-6 -4 -2
2
4
6
-6 -4 -2
2
4
6
-6 -4 -2
2
4
6
2
4
6
2
4
6
2
4
6
2
4
6
2
4
6
2
4
6
Figura 3.15: Convolução gráfica das funções f (t) e g (t).
3.1. SÉRIE E TRANFORMADA DE FOURIER
221
Sistema Linear
f( - t)
-t
-
g(t)
f(t) * g(t)
t
t
Caixa Preta
Figura 3.16: A operação de convolu ção, h(t) = f (t) ∗ g (t), esquematizada por um sistema linear, cognominado de caixa preta. preta”.(Figura 3.16). O sistema é representado pela função g (t). O sinal de entrada é representado pela função f (t) e o sinal de saída pela convolução h (τ ) = f (t) ∗ g (t). Note que o sinal de entrada deve ser girado em torno do eixo t para que as informações nos primeiros instantes do sinal, sejam as primeiras a entrarem na caixa preta. Gradativamente, o sinal de entrada f (t) vai sendo introduzido na caixa preta e concomitantemente ele vai sendo convolvido com a função g (t), gerando na saída a função h (τ ) = f (t)∗g (t) . A operação de convolução é uma máquina que entra uma função e sai outra função modificada pela máquina24 . Depois desta explicação ilustrativa, acredito que a idéia básica da convolução esteja bem alicerçada. Vamos, então, apresentar a definição formal. Dadas as funções contínuas por partes f (t) e g (t), a operação defenida pela integral Z ∞ h (τ ) = f (τ ) ∗ g (τ ) = f (τ − t) g (t) dt (3.39) −∞
é denominada convolução das funções f (t) e g (t). 24
Um aparelho de televisão, por exemplo, em que entra um sinal pela antena e sai uma imagem na tela. O sinal de entrada é convolvido pelos circuitos eletrônicos do aparelho de TV para gerar a imagem. Na exploração do petróleo acontece a mesma coisa. O geofísico envia um sinal de entrada e observa um sinal de saída convolvido pelo reservatório de petróleo. O trabalho do geofísico é localizar o reservatório através da análise dos sinais de entrada e de saída. O terreno neste caso é a máquina, ou seja, é a "caixa preta"referida no texto.
222
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR
A convoluçào é uma operação comutativa. Isto é, h (t) = f (t) ∗ g (t) = g (t)∗f (t). Com efeito, fazendo-se a seguinte mudança de variável, τ −t = η, podemos reescrever (3.39) da seguinte maneira Z ∞ h (τ ) = f (η) g (τ − η) dη, −∞
ou ainda, h (τ ) =
Z
∞
−∞
g (τ − t) f (t) dt,
em virtude da liberdade de escolha da variável de integraçào. Portanto, h (t) = f (t) ∗ g (t) = g (t) ∗ f (t) . A título de curiosidade, vamos refazer a Figura 3.15 para ilustrar a propriedade de comutatividade da convolução. Desta feita, a função f (t) será considerada fixa, ou seja, ela representa o sistema linear e g (t) a função móvel, isto é, o sinal de entrada. Para se traçar os gráficos utiliza-se a mesma seqüência de comandos In[5], In[6] com exceção de In[4] que deve ser substituído por, In[8]:= (*--- plotPulsoEpulsoR[...]: constrói os graficos dos pulsos exponencial e retangular ---*) In[9]:= (*--- Figura 3.17: retangular ---*)
Convolução gráfica dos pulsos exponencial e
Procedendo-se da mesmo modo como anteriormente, vem: Para fixar ainda mais o conceito de convolução, vamos, agora, explorar alguns exemplos com o Mathematica. Exemplo 3.12: Na construção das Figuras 3.15 e 3.17 foi usada a lista In[11] para se traçar o gráfico da convolução h (t) = f (t) ∗ g (t). Agora, chegou a hora de justificar de onde vieram aqueles números. Eles.vieram exatamente da convolução das funções f (t) (3.37) e g (t) (3.38). Com efeito, aplicando-se a definição 3.39, é fácil ver que a convolução das funções f (t) e g (t) pode ser escrita assim: ⎧ 0 t≤0 ⎪ ⎪ ⎪ ⎪ ⎨ R t −(t−x) dx 0 < t < 2 . h (t) = f (t) ∗ g(t) = 0 e ⎪ ⎪ ⎪ ⎪ ⎩ R 2 −(t−x) dx t≥2 0 e
3.1. SÉRIE E TRANFORMADA DE FOURIER
223
1
1
1
0.5
0.5
0.5
-6 -4 -2
2 4 6
-6 -4 -2
2 4 6
-6 -4 -2
1
1
1
0.5
0.5
0.5
-6 -4 -2
2 4 6
-6 -4 -2
2 4 6
-6 -4 -2
1
1
1
0.5
0.5
0.5
-6 -4 -2
2 4 6
-6 -4 -2
2 4 6
-6 -4 -2
1
1
1
0.5
0.5
0.5
-6 -4 -2
2 4 6
-6 -4 -2
2 4 6
-6 -4 -2
1
1
1
0.5
0.5
0.5
-6 -4 -2
2 4 6
-6 -4 -2
2 4 6
-6 -4 -2
1
1
1
0.5
0.5
0.5
-6 -4 -2
2 4 6
-6 -4 -2
2 4 6
-6 -4 -2
1
1
1
0.5
0.5
0.5
-6 -4 -2
2 4 6
-6 -4 -2
2 4 6
-6 -4 -2
Figura 3.17: A convolução gráfica é comutativa.
2
4
6
2
4
6
2
4
6
2
4
6
2
4
6
2
4
6
2
4
6
224
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR
Esta expressão pode ser traduzida, ipsis verbis, no Mathematica, da seguinte maneira, In[10]:= (*--- Convolução das funções f(t) e g(t) -*) Clear[t, convFG] pconvFG[t_]:= 0 /; t 2
Agora, para se obter a lista In[6] basta executar esta função convFG[...]: In[11]:= (*--- Lista de h(t) = f(t)*g(t) -*) listConvH = Table[{t, convFG[t]}, {t, -0.5, 6, 0.5}] Out[11]= {{−0.5, 0}, {0, 0), {0.5, 0.393469}, {1, 0632121}, {1.5, 0.77687}, {2, 0.864665}, {2.5, 0.524446}, {3, 0.318092}, {3.5, 0.192933},
{4, 0.11702}, {4.5, 0.070976}, {5, 0.0430491}, {5.5, 0.02611061}, {6, 0.0158369}}
Exemplo 3.13: Sejam f (t) e g (t) as seguintes funções gaussiana: 1 2 2 f (t) = √ e−t /2a a 2π
e
1 2 2 g (t) = √ e−t /2b . b 2π
em que a e b são números reais positivos. Vomos mostrar, via Mathematica, que a convolução f (t) ∗ g (t) também é uma função gaussiana, 1 2 2 f (t) ∗ g (t) = √ e−t /2c , c 2π em que c2 = a2 + b2 . Substituindo f (t) e g (t) na fórmula (2.45), a convolução f (t) ∗ g (t) é calculada pelo Mathematica do seguinte modo: In[12]:= (*--- Convolução de funções gaussianas -*) Clear[a, x, t] Integrate[Exp[-x^2/(2 a^2)]/(a Sqrt[2 Pi]) Exp[-(t - x)^2/(2 b^2)]/ (b Sqrt[2 Pi]), {x, -Infinity, Infinity}] Out[13]= If[Re[−1/(2 a2 ) − 1/(2 b2 )] < 0, e−t
R∞
2
/[2 (a2 +b2 )]
[−(t−x)2 /(2 b2 )−x2 /(2 a2) ]) dx)]/(2 a b π) −∞ e
s √ 2π/ 1/a2 + 1/b2 ,
3.1. SÉRIE E TRANFORMADA DE FOURIER
225
O Mathematica é bem inteligente! O programa analisa os parâmetros a e b para determinar o grau de validade da resposta. Como, por hipótese, os parâmetros a e b são reais, chega-se ao resultado de que a convolução de duas gaussianas é tambem uma gaussiana. Exemplo 3.14: Reescrever a integral Z ∞ e−y cos (xy) dy, x, y > 0 h (x) =
(3.40)
0
na forma de uma integral de convolução. Comparar graficamente o valor numérico desta integral com o da convolução. ¢ ¡ Usando-se o Mathematica, o valor da integral 3.40 é igual a 1/ 1 + x2 . Com efeito: In[14]:= (*--- Cálculo da integral 3.42 -*) Clear[x, y] Integrate[Exp[-y] Cos[x y], {y, 0, Infinity}] U∞ Out[15]= If[Im[x] == 0, 1/(1 + x2 ), 0 e−y cos[xy]dy]
Com uma simples transformação de variável mostra-se que a integral 2.48 é equivalente a: Z 1 ∞ −y/x e cos (y) dy, x, y > 0. h (x) = x 0 Sustituíndo x por ep e y por es , esta integral se transforma na seguinte integral de convolução: Z ∞ −p e−(s−p) es cos (es ) ds. (3.41) h (p) = e −∞
É claro que as integrais (3.40) e (3.41) são absolutamente equivalentes. Isto pode ¡ ser2 ¢verificado graficamente pela Figura 3.18 que compara o grafíco de 1/ 1 + x com o gráfico da convolução h (p) expressa por (3.41). Primeiro, vamos codificar a convolução (3.41),
In[16]:= (*--- Cálculo da convolução 3.43 -*) Clear[p, s] convH[p_]:= Exp[-p] NIntegrate[Exp[-Exp[s - p]] Exp[s] Cos[Exp[s]],
226
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR 1
0.8
0.6
0.4
0.2
1
2
3
4
5
¡ ¢ Figura 3.18: Comparação da função 1/ 1 + x2 (linha cheia) com a convolução (3.41) (linha pontilhada) calculada por In[16]. {s, -Infinity, Infinity}]
¡ ¢ Agora, podemos traçar os gráficos de 1/ 1 + x2 e da convolução ilustrados na Figura 3.18. In[18]:= (*--- Figura 3.18: Comparação de Out[15] com 3.42 -*) Clear[x] plot1 = Plot[1/(1 + x^2), {x, 0, 5}, DisplayFunction -> Identity]; x = Table[.10 i, {i, 50}]; Off[General::unfl] plot2 = ListPlot[ Transpose[{x, Table[convH[Log[x][[i]]], {i, 50}]}], DisplayFunction -> Identity]; Show[{plot1, plot2}, DisplayFunction -> $DisplayFunction];
Exemplo 3.15: Calcular com o Mathematica a convolução h(x) = f (x) ∗ g (x) das funções: ⎧ 0 x≤0 ⎪ ⎨ −2x/3 + 2 0 ”f(t)”, DisplayFunction -> Identity], Plot[(x - 2) Sin[x]^2, {x, -Pi, Pi}, PlotRange -> {{-4, 4}, {-4, 3}}, PlotLabel -> ”g(t)”, DisplayFunction -> Identity]}, {Plot[convFG[x], {x, -Pi, Pi + 3}, PlotRange -> {{-4, Pi+3}, {-9, 3}}, PlotLabel -> ”f(x)*g(x)”, DisplayFunction -> Identity]}}], DisplayFunction ->$DisplayFunction];
Exemplo 3.16: Refazer o exemplo anterior, permutando as duas funções para ilustrar a propriedade comutativa da convolução. Aplicando-se a fórmula (3.39) e respeitando os intervalos de definição de f (x) e g (x) podemos escrever f (x) ∗ g (x) ⎧ R x+π (x − y − 2) sin2 (x − y) (−2y/3 + 2) dy, 0 ≤ y ≤ x + π, ⎪ ⎪ ⎨ R0 3 = (x − y − 2) sin2 (x − y) (−2y/3 + 2) dy, 0 ≤ y ≤ 3, 0 ⎪ ⎪ ⎩ R3 2 x−π (x − y − 2) sin (x − y) (−2y/3 + 2) dy, x − π ≤ y ≤ 3,
(3.43)
3.1. SÉRIE E TRANFORMADA DE FOURIER f(t)
4
229 g(t) 3 2 1
3 2 1 1.5
2
2.5
3
3.5
4
-1
-4 -3 -2 -1 -1 -2 -3 -4
1
2
3
4
f(t)*g(t) 2 -4
-2
2
4
6
-2 -4 -6 -8
Figura 3.19: Gráficos das funções f (t), g (t) e da convolução h (t) = f (t) ∗ g (t). De modo análogo ao exemplo anterior, estas três integrais são calculadas, com o Mathematica, assim: In[33]:= (*--- Primeira integral de (3.45) -*) integralPrimeira = Integrate[Evaluate[ (x- y - 2) Sin[x- y]^2 (-2 y/3 + 2)], {y, 0, x + Pi}] // Simplify Out[34]= (3−78 π−6 π 2 +4 π 3 −75 x+24 π x+6 π2 x+30 x2 −2 x3 −3 (1 + x) Cos[2 x]+ (39 − 18 x) Sin[2 x])/36
In[35]:= (*--- Segunda integral de (3.45) -*) integralSegunda = Integrate[Evaluate[ (x- y - 2) Sin[x- y]^2 (-2 y/3 + 2)], {y, 0, 3}] // Simplify Out[36]= (−54 − 18 x + (−5 + x) Cos[6 − 2 x] − (1 − x) Cos[2 x] + Sin[6 − 2 x]+ 13 Sin[2 x] − 6 x Sin[2 x])/12
In[37]:= (*--- Terceira integral de (3.45) -*) integralTerceira = Integrate[Evaluate[ (x- y - 2) Sin[x- y]^2 (-2 y/3 + 2)], {y, x - Pi, 3}]
230
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR // Simplify Out[38]= (−165 − 78 π + 6 π2 + 4 π3 + 129 x + 24 π x − 6 π2 x − 30 x2 + 2 x3 − 3 (−5 + x) Cos[8 − 2 x] + 3 Sin[6 − 2 x])/16
Embora aparentemente diferentes, estes resultados são idênticos aos obtidos no exemplo anterior. Com efeito: In[39]:= (*--- Comutatividade da convolução:
f(x)*g(x) = g(x)*f(x) -*)
{primeiraIntegral - integralPrimeira,
segundaIntegral - integraSegunda, terceiraIntegral - integralTerceira} // Simplify Out[39]= (0, 0, 0}
Fica assim estabelecida a comutatividade da convolução das funções f (x) e g (x). Após esta incursão no terreno da convolução, estamos, agora, preparado para responder a questão, formulada na página 210, de como a transformada de Fourier do produto de duas funções se relaciona com as transformadas de Fourier de cada uma das duas funções que compõe o produto. A resposta será dada por um teorema importantíssimo, chamado de teorema da Convolução. Este teorema simplesmente afirma que a transformada de Fourier da convolução de duas funções, no domínio do tempo, é equivalente ao produto das funções, no domínio da freqüência. Reciprocamente, a transformada inversa de Fourier da convolução de duas funções, no domínio da freqüência, é equivalente ao produto das funções, no domínio do tempo, multiplicado pelo fator 2π. Então, vamos ao enunciado do teorema.
Teorema 2.5 (Teorema da Convolução): Se F [f (t)] = fb(ω) e F [g (t)] = gb (ω), então F [f (t) ∗ g (t)] = fb(ω) gb (ω) . (3.44) h i De modo recíproco, se F−1 fb(ω) = f (t) e F−1 [g (t)] = g (t), então h i F−1 fb(ω) ∗ gb (ω) = 2πf (t) g (t)
(3.45)
3.1. SÉRIE E TRANFORMADA DE FOURIER
231
Prova: A demostração do teorema se resume em aplicar a definição (3.39) de convolução e usar a propriedade de deslocamento do tempo (3.31) da transformada de Fourier. Com efeito, a transformada de Fourier de f (t) ∗ g (t) é expressa por ¸ Z ∞ ∙Z ∞ f (τ ) g (t − τ ) dτ e−iωt dt. F [f (t) ∗ g (t)] = −∞
−∞
Permutando a ordem de integração, vem: ∙Z ∞ ¸ Z ∞ −iωt F [f (t) ∗ g (t)] = f (τ ) g (t − τ ) e dt dτ , −∞
(3.46)
−∞
e aplicando a propriedade de deslocameto no tempo, (3.31) na integral interna, Z ∞ g (t − τ ) e−iωt dt = gb (ω) e−iωτ , −∞
podemos reescrever (3.46) da seguinte maneira: Z ∞ F [f (t) ∗ g (t)] = f (τ ) gb (ω) e−iωτ dτ −∞ ∙Z ¸ ∞ −iωτ = f (τ ) e dτ gb (ω) −∞ ∙Z ∞ ¸ −iωt = f (t) e dt gb (ω) = fb(ω) gb (ω) . −∞
A demostração da segunda parte do teorema é trivial, por isso, ela fica a cargo do leitor. ¥ Exemplo 2.17: Para ilustrar o teorema da convolução vamos usar as mesmas funções f (t) e g (t) do Exemplo 2.44 A ilustração será feita por meio de gráficos, comparando os espectros de amplitude de fb(ω) gb (ω) e de F [f (t) ∗ g (t)]. Para se ter melhor visualização dos pormenores do ajuste das curvas, os gráficos serão ilustrados em duas escalas diferentes. Primeiro, vamos calcular o produto fb(ω)¯ gb (ω) das ¯transformadas de ¯ ¯ Fourier de f (t) e g (t) e preparar o gráfico de ¯fb(ω) gb (ω)¯. Então, In[40]:= (*--- produtoTransFourierdeFeG[expr]: calcula o produto das transformadas das funções f(t) e g(t) ---*) produtoTransFourierdeFeG[w_]:= Module[{},
232
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR Evaluate[NIntegrate[(-2 t/3 + 2) Exp[-I w t], {t, 0, 3}]* NIntegrate[(t - 2) Sin[t]^2 Exp[-I w t], {t, -Pi, Pi}]]] In[41]:= (*--- Ativa o pacote Add On:
d/2, 1]] In[2]:= (*--- funDn[expr]: Função Dn(t) ---*) funDn[t_,d_]:= Module[{}, Which[ t < -d/2, 0 -d/2 < t < d/2, 1/d t > d/2, 0]]
De posse de In[1] e In[2] é fácil construir os gáficos dos três primeiros termos das seqüências Hn (t) e Dn (t). Os procedimentos In[3] e In[4] constroem os gráficos de Hn (t) e de Dn (t) e In[5] traça os gráficos. In[3]:= (*--- plotFunHn[expr]: constrói o gráfico de Hn(t) ---*) plotFunHn[d_]:= Plot[Evaluate[funHn[t, d], {t, -3, 3}], TextStyle -> {FontSize -> 7.0}, Ticks -> {Automatic, {0, 0.5, 1}}, DisplayFunction -> Identity] In[4]:= (*--- plotFunDn[expr]: constrói o gráfico de Dn(t) ---*) plotFunDn[d_]:= Plot[Evaluate[funDn[t, d], {t, -3, 3}], TextStyle -> {FontSize -> 7.0}, Ticks -> {Automatic, {0, 0.5/d, 1/d}}, DisplayFunction -> Identity] In[5]:= (*--- Figura 3.21: gráfico de Hn(t) e Dn(t) ---*) Show[GraphicsArray[{{plotFunHn[1], plotFunHn[1/2], plotFunHn[1/5]}, {plotFunDn[1], plotFunDn[1/2], plotFunDn[1/5]}}], DisplayFunction -> $DisplayFunction];
1
1
1
0.5
0.5
0.5
-3 -2 -1
1
2
3
-3 -2 -1
1
2
3
-3 -2 -1
1
2
5
0.5
1
2.5
-3 -2 -1
1
2
3
-3 -2 -1
1
2
3
-3 -2 -1
1
2
3
1
2
3
Ilustação gráfica das seqüências Hn (em cima) e Dn (em baixo).
236
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR
Note que a escala vertical dos gráficos da seqüência Dn (t) aumenta à medida que o valor de dn descrece. Todavia, a área subtendidas por cada Dn (t) permanece igual a um. Intuitivamente, à medida que n → ∞ (dn → 0) a derivada de Hn (t) no intervalo [−dn /2, dn /2] também tende a infinito. Contudo, a área permanece inalterada. Vamos usar esta intuição para definir a "derivada "no ponto t = 0 da função f (t) = 0 se t < 0 e f (t) = 1 se t > 0 Para isso vamos tomar uma função auxiliar φ (t) de classe C 1 e que se anula fora de um intervalo finito qualquer, chamada de função teste, e calcular a área do produto Dn (t − t0 ) φ (t). A figura abaixo ilustra a função teste φ (t) junto com a função Dn (t − t0 ) com t0 > 0, 1/d
phi(t)
t0 - d/2
t0 + d/2
Figura 3.21: Produto do pulso retangular Dn = 1/dn com a função teste φ(t). In[6]:= (*--- Figura 2.92:
gráfico do produto de Dn(t) com ---*)
uma função teste ---*) Plot[{funDn[t - 2.5, 0.1], 8 Exp[-(t - 2)^2]}, {t, 0, 5}, Ticks -> None, Epilog -> {Text[”\[Phi](t)”, {3.2, 3.5}], Text[ ” 1/dn”, {2.8, 9.5}], Text[”t0 - d/2
t0 + d/2”, {2.5, 0.3}]}];
Observando a Figura 3.21 nota-se que a área do produto Dn (t − t0 ) φ (t) é aproximadamente igual a φ (t0 ), pois, fora do intervalo [t0 −dn /2, t0 +dn /2] a área é igual a zero e dentro do intervalo, a área é aproximadamente φ (t0 ) vezes a área subtendida por Dn (t − t0 ) que é praticamente igual a um. Simbolicamente, Z
∞
−∞
Dn (t − t0 ) φ (t) dt ∼ = φ (t0 )
Z
t0 +dn /2
t0 −dn /2
1 dt = φ (t0 ) dn
(3.47)
3.1. SÉRIE E TRANFORMADA DE FOURIER
237
Note que com a mudança de variável t − t0 = τ , a integral do lado esquerdo de 3.47 pode ser reescrita assim Z
∞
Dn (τ ) φ (τ + t0 ) dτ =
−∞
Z
∞
Dn (t) φ (t + t0 ) dt
(3.48)
−∞
Feitas essas considerações, vamos, agora, definir duas funções generalizadas importantíssimas. A primeira é a função de Heaviside e a segunda é função delta de Dirac. A função de Heaviside H (t) é definida pela integral Z ∞ Z ∞ H (t) φ (t) dt = φ (t) dt, −∞
(3.49)
0
ou simbolicamente por H (t) =
(
0,
t0
.,
(3.50)
como o limite da seqüência Hn (t) quando n → ∞. Agora a definição da função delta de Dirac: A função Delta de Dirac é definida pela integral Z ∞ δ (t − t0 ) φ (t) dt = φ (t0 )
(3.51)
−∞
Em termos heurísticos, de acordo com 3.47, a função delta de Dirac é "definida", como o limite da seqüência Dn (t) quando n → ∞. A função delta de Dirac é também conhecida como impulso no ponto t0 . Por que a função de Heaviside é uma função generalizada? Bom, se continuássemos usando a função f (t) = 0 se t < 0 e f (t) = 1 se t > 0 sem nos preocuparmos com a derivada no ponto t = 0, ela seria simplesmente uma função ordinária como tantas outras. Mas, se exigirmos que ela tenha derivada no ponto t = 0, então este novo objeto é a função generalizada de Heaviside. E quem seria esta derivada? Seria exatamente a função generalizada delta de Dirac! Jocosamente, podemos dizer que a função de Heaviside é a função f (t) = 0 se t < 0 e f (t) = 1 se t > 0 temperada.
238
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR
Para tornar estas idéias mais precisas, vamos definir a derivada de uma função generalizada f (t) da seguinte maneira Z ∞ Z ∞ f 0 (t) φ (t) dt = − f (t) φ0 (t) dt, (3.52) −∞
−∞
em que φ (t) é uma função teste. Com esta definição, a derivada da Função de Heaviside pode ser expressa por Z Z ∞
−∞
∞
H 0 (t) φ (t) dt = −
Mas, de 3.49, Z Z ∞ 0 H (t) φ (t) dt = − −∞
∞
0
H (t) φ0 (t) dt.
−∞
φ0 (t) dt = − [φ (∞) − φ (0)] = φ (0) ,
porque φ (∞) = 0. Então, de ??, Z ∞ Z 0 H (t) φ (t) dt = −∞
∞
δ (t) φ (t) dt.
−∞
Para tornar o texto mais leve e a liguagem menos pedante, continuaremos usando a palavra função no lugar de função generalizada ou distribuição, todavia, fica subtendido que as funções de Heaviside e delta de Dirac não são funções ordinárias no pé da letra. É praxe simbolizar a função delta de Dirac por δ (t), mas, deve-se ter em mente que em qualquer situação (sem exceção) a função delta de Dirac nunca aparece solta, isolada, mas sempre casada com uma função teste de acordo com 3.49 ou 3.50. Por isso, é comum abusar da linguagem e escrever simbolicamente dH (t) = δ (t) (3.53) dt A função delta de Dirac é uma função par, isto é, δ (−t) = δ (t). Com efeito, basta fazer a mudança de variável at = τ na integral Z ∞ δ (at) φ (t) dt H 0 (t) =
−∞
e observar que Z ∞ δ (at) φ (t) dt = −∞
=
µ ¶ Z ∞ t 1 1 δ (t) φ dt = φ (0) |a| −∞ a |a| Z ∞ Z ∞ 1 1 δ (t) φ (t) dt. δ (t) φ (t) dt = |a| −∞ −∞ |a|
3.1. SÉRIE E TRANFORMADA DE FOURIER
239
Comparando a primeira e a última integrais, podemos escrever, simbolicamente, 1 δ (t) . δ (at) = |a| Finalmente, fazendo a = −1, conclui-se que δ (−t) = δ (t). Tendo resolvido a questão da derivada da função de Heaviside, retornemos, agora, ao problema da transformada de Fourier da função f (t) = 1, t ∈ R, argüido acima. Mas antes de fazê-lo, cumpre verificar que a transformada de Fourier da função delta de Dirac é a função f (t) = 1, t ∈ R. Com efeito, de (3.51) vem Z ∞ ¯ δ (t) e−iωt dt = e−iωt ¯t=0 = 1, −∞
ou simbolicamente
F [δ (t)] = 1
(3.54)
Agora estamos prontos para calcular a transformada de Fourier da função f (t) = 1, t ∈ R. Com efeito, basta aplicar a propriedade da simetria (3.36) na identidade acima e observar que δ (−ω) = δ (ω). Assim, tem-se informalmente, F [1] = 2πδ (−ω) = 2πδ (ω) . (3.55) ou mais rigorosamente, Z Z ∞ F [1] φ (ω) dω = 2π −∞
∞
δ (ω) φ (ω) dω = 2πφ (0)
−∞
sendo φ (t) uma função teste. Existem muitas outras maneiras de introduzir a função delta de Dirac. Uma delas seria, por exemplo, estabelecer a identidade (3.54) como um axioma e concluir que Z ∞ Z ∞ 1 1 −1 iωt 1e dω = eiωt dω δ (t) = F [1] = 2π −∞ 2π −∞ Z ∞ Z ∞ 1 i = cos ωtdω + sin ωtdω 2π −∞ 2π −∞ Z ∞ 1 = cos ωtdω, (3.56) π 0 em que se usou o fato do co-seno e seno serem par e ímpar, respectivamente. Esta identidade significa que a função delta de Dirac pode ser interpretada heuristicamente pela ”soma” contínua de todos os co-senos, dividida por
240
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR
π. O fato importante é que a função generalizada 3.56 poderia ser usada também como definição da função delta de Dirac. Alternativamente, poderíamos ter usado (3.56) como axioma e deduzir (3.54) como uma simples conseqüência. Em verdade, estas duas identidades são equivalentes. Elas simplesmente revelam que a função delta de Dirac é constituída por um continuum de harmônicos de amplitude igual a um. Da mesma maneira, a identidade (3.55) afirma que a função identicamente igual a um não possui nenhum harmônico. À guisa de curiosidade seria assaz interessante analisar graficamente a versão discreta da identidade (3.56). É o que faremos agora. Com efeito, é fácil mostrar que a versão discreta de (3.56),é dada por ∞ X
n=1
δ (t − nT ) =
∞ 2X 1 + cos 2πnt/T T T
(3.57)
n=1
sendo T o período. O somatório do lado esquerdo é conhecido como trem de impulsos. A função tremImpulsos[expr] a seguir implementa (3.57) e constrói os gráficos de diferentres trens de impulsos:. In[7]:= (*--- tremDeImpulsos[expr]: trem de impulsos ---*)
constrói os gráficos de
Com o código acima, vamos apresentar três exemplos, formados, individualmente, por quatro trens de impulsos contendo 2, 5, 10 e 100.harmônicos (co-senos) respectivamente. Em todos os casos foram usados 100 intervalos de 0.05 unidades de tempo. No primeiro exemplo, tomou-se o período igual a 20 unidades de tempo, no segundo, 60 e no terceiro 120.unidades de tempo. In[8]:= (*--- Figura 2.93:
Harmônicos de trem de impulsos ---*)
In[9]:= (*--- Figura 2.94:
Harmônicos de trem de impulsos ---*)
In[10]:= (*--- Figura 2.95:
Harmônicos de trem de impulsos ---*)
Observando os gráficos destas três últimas figuras nota-se que à medida que o número de harmônico cresce, o trem de impulsos vai, gradativamente, se delineando.Por outro lado, com o aumento contínuo do período o trem de impulsos vai se tornando cada vez mais rarefeito até se reduzir a um único impulso na origem. Em outras palavras, o trem de impulsos se dissolve
3.1. SÉRIE E TRANFORMADA DE FOURIER
241
(a)
(b)
0.25
0.6
0.2 0.4
0.15 0.1
0.2 0.05 -100 -75
-50
-25 -0.05
25
50
75
100
-100 -75
-50
-25
25
(c)
-100 -75
-50
75
50
75
100
(d)
1.25
12.5
1
10
0.75
7.5
0.5
5
0.25
2.5
-25 -0.25
50
-0.2
-0.1
25
50
75
100
-100 -75
-50
-25 -2.5
-0.5
25
100
-5
Figura 3.22: Espectros com dois (a), cinco (b), vinte (c) e cem (d) harmônicos (co-senos) do trem de pulsos retangulares com dn /T = 1/20.
(a)
-100
-75
-50
(b)
0.08
0.2
0.06
0.15
0.04
0.1
0.02
0.05
-25
25
50
75
100
-100
-75
-50
-0.02
-25
25
(c)
-100
-75
-50
4
0.3
3
0.2
2
0.1
1
-0.1
75
100
50
75
100
(d)
0.4
-25
50
-0.05
25
50
75
100
-100
-75
-50
-25
25 -1
Figura 3.23: Espectros com dois (a), cinco (b), vinte (c) e cem (d) harmônicos (co-senos) do trem de pulsos retangulares com dn /T = 1/60.
242
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR (b)
(a) 0.1
0.04
0.08
0.03
0.06 0.02 0.04 0.01
-100
-75
-50
0.02
-25
25
50
75
100
-100
-75
-50
-0.01
-25 -0.02
25
50
75
100
25
50
75
100
-0.04 (c)
-100
-75
-50
(d)
0.2
2
0.15
1.5
0.1
1
0.05
0.5
-25
25
50
75
100
-0.05
-100
-75
-50
-25 -0.5
Figura 3.24: Espectros com dois (a), cinco (b), vinte (c) e cem (d) harmônicos (co-senos) do trem de pulsos retangulares com dn /T = 1/120. completamente, restando apenas a função delta de Dirac, constituída de um número infinito de harmônicos de amplitude igual a um, em conformidade com as identidades (3.56) e (3.57). Em virtude da relevância das funções de Heaviside e delta de Dirac em eletromagnetismo é oportuno destacar, mais uma vez, os resultados (3.53), (3.54) e (3.55): No sentido das funções generalizas: • A função delta de Dirac é a derivada da função de Heaviside no ponto zero. • A transformada de Fourier da função delta de Dirac é a função identicamente igual a 1. • A transformada de Fourier da função f (t) = 1, t ∈ R é 2πδ (w). O Mathematica trata as funções de Heaviside27 UnitStep[expr] e delta de Dirac DiracDelta[expr] com extrema simplicidade. Se não vejamos: 27
O Mathematica denomina a função de Heaviside de UnitStep ou seja, "degrau unitário". Nós não adotaremos esta nomenclatura porque o termo degrau unitário será usado, mais adiante, num outro contexto.
3.1. SÉRIE E TRANFORMADA DE FOURIER
243
Exemplo 3.18: Calcular a derivada da função de Heaviside no ponto zero. In[11]:= (*--- Derivada da função de Heaviside ---*) D[UnitStep[t], t] Out[11]=
DiracDelta[t]
Exemplo 3.19: Calcular as transformadas de Fourier da função delta de Dirac: In[12]:= (*--- Transformada de Fourier da função delta de Dirac ---*) FourierTransform[DiracDelta[t], t, w, FourierParameters -> {1,-1}] Out[12]=
1
Exemplo 3.20: Calcular as transformadas da função f (t) = 1, t ∈ R: In[13]:= (*--- Transformada de Fourier da função identicamente igual a 1 ---*) FourierTransform[1, t, w, FourierParameters -> {1,-1}] Out[13]=
2πDiracDelta[1]
Exemplo 3.21: Calcular as transformadas direta e inversa da função de Heaviside (função degrau unitário): In[14]:= (*--- Transformada direta e inversa de Fourier da função de Heaviside ---*) FourierTransform[UnitStep[t], t, w, FourierParameters -> {1,-1}] Out[14]= 1/2(−2i/w + 2πDiracDelta[t])
Exemplo 3.22: Vamos calcular a transfornmada de Fourier do pulso retangular definido por ( a, |t| < 12 d, pd (t) = . 0, |t| > 12 d. Esta função também pode ser expressa da seguinte maneira pd (t) = H (t − d/2) − H (t + d/2)
244
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR
em que H (t) é a função de Heaviside ou degrau unitário. Esta última representação é mais apropriada quando se deseja usar o Mathematica. Com efeito, para se obter o pulso retangular basta executar o seguinte comando: In[15]:= (*--- pulsoRetangular[expr]: pulso retangular ---*) Clear[d, t] pulsoRetangular[d_, t_] = UnitStep[t + d/2] - UnitStep[t - d/2];
O cálculo da transformada de Fourier do pulso retangular é igualmente simples. De fato, basta teclar In[17]:= (*--- Transformada de Fourier do pulso retangular ---*) Clear[d, t, w] transFourierpulsoRetangular = FourierTransform[pulsoRetangular[d, t], t, w, FourierParameters -> {1,-1}] // FullSimplifyl Out[18]= 2 Sin[dw/t]/w
Para concluir, seguem os gráficos do pulso retangular e da sua transformada de Fourier: In[19]:= (*--- Constrói o gráficos do pulso retangular ---*) In[20]:= (*--- Constrói o gráficos da transformada de Fourier do pulso retangular ---*) In[21]:= (*--- Figura 2.96: Traça os gráficos do pulso retangular e de sua transformada de Fourier ---*) Show[GraphicsArray[{graficoA, graficoB}], DisplayFunction -> $DisplayFunction];
Exemplo 3.23: Calcular a transfornmada de Fourier do pulso exponencial unilateral, definido por ( 0, t < 0, pexp (t) = . e−at , t > 0. Obviamente, o pulso exponencial unilateral é formado pelo produto da função exponencial com a função de Heaviside. Assim, com o Mathematica se escreve
3.1. SÉRIE E TRANFORMADA DE FOURIER (a) 2
245 (b) 5 4
1.5
3 1
2 1
0.5 -20 -3
-2
-1
1
2
-10
3
10
20
-1
Figura 3.25: Pulso retangular e sua transformada de Fourier. In[22]:= (*--- Pulso exponencial unilateral ---*) pulsoExp[a_, t_] = UnitStep[t] Exp[-a t];
Com a mesma simplicidade obtemos a transformada de Fourier do pulso exponencial unilateral. In[24]:= (*--- Transformada de Fourier do pulso exponencial unilateral ---*) tFPulsoExp = FourierTransform[UnitStep[t] Exp[-a t], t, w, FourierParameters -> {1,-1}] Out[25]= 1/(a + i w)
O pulso exponencial unilateral é uma função nem par nem ímpar, portanto sua tranformada de Fourier é complexa. O gráfico da função e das componentes real e imáginária da transformada de Fourier são dados a seguir. Observe que a componente real é uma função par e a componente imaginária é uma função impar. Isto deve-se ao fato do pulso esponencial unilateral ser uma função de variável real. In[26]:= (*--- Constrói o gráfico (a) do pulso exponencial unilateral ---*) In[27]:= (*--- Constrói o gráfico (b) da componente real da transformada de Fourier ---*) In[28]:= (*--- Constrói o gráfico (c) da componente imaginária da transformada de Fourier ---*) In[29]:= (*--- Figura 2.97:
Traça os gráficos do pulso exponencial
246
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR
(a) 1
(b) 0.5
0.8
0.4
0.6
0.3
0.4
0.2
0.2
0.1
-3 -2 -1
1
2
3
-10
-5
(c) 0.3 0.2 0.1 -10
5
10
-5 -0.1 -0.2 -0.3
5
10
Figura 3.26: Pulso exponencial e as componentes real e imaginária de sua transformada de Fourier. unilateral e de sua transformada de Fourier ---*) Show[GraphicsArray[{graficoA, graficoB, graficoC}], DisplayFunction -> $DisplayFunction];
Exemplo 3.24: Vamos, agora, calcular a transfornmada de Fourier do pulso exponencial bilateral par, definido por: pexpp (t) = e−a|t| Como nos exemplos anteriores, é muito simples o cálculo da transformada de Fourier do pulso exponencial bilateral par. Com efeito, In[30]:= (*--- Pulso exponencial bilateral par.
---*)
pulsoExpPar[a_, t_] = Exp[-a Abs[t]]; In[32]:= (*--- Transformada de Fourier do pulso exponencial bilateral par. ---*) tFpulsoExpPar = FourierTransform[pulsoExpPar[a, t], t, w, FourierParameters -> {1,-1}] Out[32]= 2a/(a2 + w2 )
Como o pulso pexpp (t) é uma função real par, a sua transformada de Fourier é tamém par e real, como ilustra a Figura (3.27). In[34]:= (*--- Constrói o gráfico (a) do pulso exponencial bilateral par ---*)
3.1. SÉRIE E TRANFORMADA DE FOURIER (a) 1
-3
-2
-1
247 (b) 1
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2 1
2
3
-10
-5
5
10
Figura 3.27: Pulso exponencial bilateral par sua transformada de Fourier. In[35]:= (*--- Constrói o gráfico (b) da transformada de Fourier do pulso exponencial bilateral par ---*) In[36]:= (*--- Figura 2.98: Traça os gráficos do pulso exponencial bilateral par e de sua transformada de Fourier ---*) Show[GraphicsArray[{graficoA, graficoB}], DisplayFunction -> $DisplayFunction];
Exemplo 3.25: Para complementar o exemplo anterior é conveniente calcular a transfornmada de Fourier do pulso exponencial bilateral ímpar, definido por ( −αt e , t > 0, pexpi (t) = t < 0. −eαt , Com o auxílio da função de Heaviside, o pulso exponencial bilateral ímpar pode ser expresso com o Mathematica da seguinte maneira: In[37]:= (*--- Pulso exponencial bilateral ímpar. ---*) pulsoExpImpar[a_, t_] = -UnitStep[-t] Exp[a t] + UnitStep[t] Exp[-a t];
Pelo fato de ser uma função real impar, a sua transformada de Fourier é uma função imaginária ímpar. Portanto, In[39]:= (*--- Transformada de Fourier do pulso exponencial bilateral ímpar. ---*)
248
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR tFpulsoExpImpar = FourierTransform[pulsoExpImpar[a, t], t, w, FourierParameters -> {1,-1}] // Simplify Out[40]= -2iw/(a2 + w2 )
Os gráficos de pexpi (t) e da transformada de Fourier são ilustrados abaixo. In[41]:= (*--- Constrói o gráfico (a) do pulso exponencialr bilateral ímpar ---*) In[42]:= (*--- Constrói o gráfico (b) da transformada do pulso exponencial bilateral ímpar ---*)
de Fourier
In[43]:= (*--- Figura 3.29: Traça os gráficos do pulso exponencial bilateral ímpar e de sua transformada de Fourier ---*) Show[GraphicsArray[{graficoA, graficoB}], DisplayFunction -> $DisplayFunction];
(a) 1
(b) 0.6 0.4
0.5 0.2 -3
-2
-1
1
2
3
-10
-5
5
10
-0.2 -0.5 -0.4 -1
-0.6
Figura 3.28: Pulso exponencial bilateral ímpar e sua transformada de Fourier. Exemplo 3.26: Um pulso muito importante em eletromagnetismo é chamado pulso gaussiano, definido por: 2 /2a2 )
pgaussiano (t) = e−t
A transformada de Fourier de um pulso gaussiano é também um pulso gaussiano. Com efeito, In[44]:= (*--- Pulso gaussiano. ---*) pulsoGaussiano = Exp[-t^2/(2a^2)];
3.1. SÉRIE E TRANFORMADA DE FOURIER
249
In[45]:= (*--- Transformada de Fourier do pulso gaussiano.
---*)
tFpulsoGaussiano = FourierTransform[pulsoGaussiano, t, w, FourierParameters -> {1, -1}] √ 2 2 √ Out[45]= -ew /(2a ) 2π/ a2 In[46]:= (*--- Constrói o gráfico (a) do pulso gaussiano.
---*)
In[47]:= (*--- Constrói o gráfico (b) do pulso gaussiano. In[48]:= (*--- Figura 3.30:
da transformada de Fourier
---*) Traça os gráficos do pulso gaussiano
e de sua transformada de Fourier ---*) Show[GraphicsArray[{graficoA, graficoB}], DisplayFunction -> $DisplayFunction] (a) 1
-4
-3
-2
(b) 2.5
0.8
2
0.6
1.5
0.4
1
0.2
0.5
-1
1
2
3
4
-4
-3
-2
-1
1
2
3
4
Figura 3.29: Gráficos do pulso gaussiano (a) e de sua transformada de Fourier (b), também uma função gaussiana.
Exemplo 3.27: Outro pulso importante em eletromagnetismo é o pulso triangular, definido por ⎧ 0, |t| ≥ 3, ⎪ ⎪ ⎨ t/3 + 1, t ≤ 0, pT (t) = ⎪ ⎪ ⎩ −t/3 + 1, t < 3. .
In[49]:= (*--- Pulso triangular.
---*)
pulsoT[t_]:= Module[{}, Which[Abs[t] >= 3, 0, t 0, -t/3 + 1]] In[50]:= (*--- Transformada de Fourier do pulso triangular. ---*) tFpulsoT = Integrate[(t/3 + 1) Exp[-I w t], {t, -3, 0}] + Integrate[(-t/3 + 1) Exp[-I w t], {t, 0, 3}] // FullSimplify Out[50]= -4 Sin[3 w/2]2 /(3 w2 ) In[51]:= (*--- Constrói o gráfico (a) do pulso triangular ---*) In[52]:= (*--- Constrói o gráfico (b) da transformada de Fourier do pulso triangular ---*) In[53]:= (*--- Figura 3.31: Traça os gráficos do pulso triangular e de sua transformada de Fourier ---*) Show[GraphicsArray[{graficoA, graficoB}], DisplayFunction -> $DisplayFunction];
Exemplo 3.28: Finalmente, vamos calcular a transformada de Fourier do pulso GPR ⎧ 0, t < 0, ⎪ ⎪ ⎨ pGP R (t) = e−t/2 sin 2πt/3, 0 ≤ t ≤ 3, ⎪ ⎪ ⎩ 0, t > 3. Trata-se de um pulso muito importante em nossos estudos. No decorrer do livro.teremos oportunidade de utilizá-lo reiteradas vezes e lá saberemos porque essa denominação de pulso GPR.
3.1. SÉRIE E TRANFORMADA DE FOURIER
251
0.8 0.6 0.4 0.2
0.5
1
1.5
2
2.5
3
-0.2 -0.4
Figura 3.31: Pulso GPR Para se ter idéia do jeitão desse pulso, vamos traçar-lhe o gráfico.. Mas antes, precisamos traduzir sua definição em linguagem Mathematica. Então, In[54]:= (*--- Pulso GPR. ---*) pulsoGPR[t_]:= Exp[-t/2] Sin[2 Pi t/3] UnitStep[t]* (1 - UnitStep[t - 3])
Agora vejamos o gráfico, mostrado na Figura (3.13). In[55]:= (*--- Figura 3.32: Gráfico do pulso GPR. ---*) Plot[pulsoGPR[t], {t, 0, 3}, PlotRange -> {-0.4, 0.8}];
Feito o gráfico, vomos agora calcular a transformada de Fourier do pulso GPS In[55]:= (*--- Transformada de Fourier do pulso GPR. ---*) tFpulsoGPR = FourierTransform[pulsoGPR[t], t, w, FourierParameters -> {1, -1}] // FullSimplify Out[57]= 24(1 − e−3/2−3iw )π/(16π 2 − 9(i − 2w)2 )
A título de ilustração vomos traçar os gráficos da parte real e da parte imaginária da transformada de Fourier do In[58]:= (*--- Figura 3.33: Gráficos das componentes real e imaginária do pulso GPR ---*)
252
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR (a) 0.8
(b) 0.8 0.6
0.6
0.4 0.4
0.2
0.2
-15
-10
-5
5
10
15
-0.2 -15
-10
-5
5
10
15
-0.4
-0.2
-0.6
-0.4
-0.8
Figura 3.32: Componentes real e imaginária da transformada de Fourier do pulso GPR. A Figura 3.14 mostra os gráficos gerados por In[5]. Como o pulso GPS é uma função real, a parte real da sua transformada de Fourier é par e a parte imaginária é impar. O conteúdo da próxima seção só será requisitado no décimo capítulo. Assim, o leitor pode ir direto à seção seguinte e retornar quando lhe convier.
3.1.5
Sistema linear causal28
As transformadas de Fourier (3.27) e (3.28) são válidas tanto para funções reais quanto complexas. Entretanto, em muitas situações, a função f (t) além de ser real é também causal, isto é, f (t) = 0 para t < 0. Neste caso, as integrais (3.27) e (3.28) se simplificam bastante. Com efeito, supondo f (t) real, podemos escrever as componentes real e imaginária de fˆ (ω) da seguinte maneira: Z ∞ Z ∞ ˆ ˆ f (t) cos ωtdt e Im f (ω) = − f (t) sin ωtdt, Re f (ω) = −∞
−∞
daí se conclui que Re fˆ (−ω) = Re fˆ (ω)
e
Im fˆ (−ω) = − Im fˆ (ω) ,
ou seja, a componente real de fb(ω) é par e a componente imaginária é impar. Resulta daí que fˆ (−ω) = fˆ∗ (ω), em que o sobrescrito ∗ significa conjugação complexa. Com essas observasões, podemos reescrever (3.27) da 28 O conteúdo desta subseção será utilizado, apenas, no último capítulo. O leitor, se assim desejar, pode adiar a leitura da subseção sem nenhum prejuízo ao demais capitulo.
3.1. SÉRIE E TRANFORMADA DE FOURIER seguinte maneira: f (t) = = =
253
Z ∞h i 1 Re fˆ (ω) cos ωt − Im fˆ (ω) sin ωt dω 2π −∞ Z i 1 ∞h Re fˆ (ω) cos ωt − Im fˆ (ω) sin ωt dω π 0 Z ∞ 1 Re fˆ (ω) eiωt dω π −∞
(3.58)
Se além de real, a função f (t) for causal (f (t) = 0, para t < 0) então, Z i 1 ∞h f (t) = Re fˆ (ω) cos ωt − Im fˆ (ω) sin ωt dω π 0 Z i 1 ∞h f (−t) = Re fˆ (ω) cos ωt + Im fˆ (ω) sin ωt dω = 0. π 0 Somando-se estas duas últimas integrais, obtém-se Z 2 ∞ Re fˆ (ω) cos ωtdω. f (t) = π 0
(3.59)
Se ao invés de somar, subtraíssemos a segunda equação da primeira, obteríamos Z 2 ∞ f (t) = − Im fˆ (ω) sin ωtdω. (3.60) π 0
Essas duas últimas integrais revelam que uma função real causal no domínio do tempo pode ser obtida tanto da componente real quanto da componente imaginária da função no domínio da freqüência. Nas aplicações em eletromagnetismo é muito importante a convolução de uma função real causal com a função de Heaviside, ou seja, a determinação da resposta da função de Heaviside a um sistema linear caracterizado por uma função real causal. Seja f (t) uma função real causal e consideremos h+ (t) a convolução de H (t) e f (t), isto é, Z ∞ Z t + H (t − τ ) f (τ ) dτ = f (τ ) dτ (3.61) h (t) = −∞
0
Mais adiante veremos o porquê do sobrescrito + empregado em h+ (t). Aplicando-se o teorema da convolução e sabendo-se que a transformada da função de Heaviside29 é expressa, simbolicamente, por ˆ (ω) = πδ (ω) + 1 , H iω 29
Veja o resultado Out[115], página 86.
254
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR
podemos escrever ¶ µ ´ 1 ³ Re fˆ (ω) + i Im fˆ (ω) . h (ω) = πδ (ω) + iω ˆ+
Efetuando a multiplicação e lembrando-se que Im fˆ (0) = 0, resulta ˆ ˆ ˆ + (ω) = π Re fˆ (0) δ (ω) + Im f (ω) − i Re f (ω) . h ω ω Finalmente, efetuando a transformada inversa e levando em consideração o fato de h+ (t) ser uma função real, podemos, de acordo com (3.58), escrever Z ∞ 1 + ˆ + (ω) eiωt dω. h h (t) = Re π 0 Sendo f (t) uma função causal e em virtude de (3.59), esta integral se reduz a # Z " ˆ (ω) 2 ∞ Im f + h (t) = cos ωtdω π Re fˆ (0) δ (ω) + π 0 ω Z 2 ∞ Im fˆ (ω) = Re fˆ (0) + cos ωtdω, (3.62) π 0 ω ou, em virtude de (3.60), se reduz a Z 2 ∞ Re fˆ (ω) sin ωtdω. h+ (t) = π 0 ω
(3.63)
Portanto, a resposta da função de Heaviside a um sistema linear causal, invariante no tempo, é dada, indistintamente, por (3.62) ou (3.63). Nas aplicações é preferível a segunda fórmula por ser ligeiramente mais simples do ponto de vista computacional. A exemplo da função de Heaviside, vamos, agora, determinar a resposta da função delta de Dirac a um sistema linear causal invariante no tempo. Como se sabe, ela é simplesmente a convolução da função delta de Dirac com a função definidora do sistema linear. Equivalentemente, trata-se da transformada inversa de Fourier do produto da transformada de Fourier da função delta de Dirac (no caso, a função identicamente igual a 1) com a transformada de Fourier da função definidora do sistema. Como, por hipótese, o sistema é causal e invariante no tempo, a citada transformada inversa de Fourier é, precisamente, análoga a qualquer uma das duas expressões (3.59) e (3.60) vistas há pouco.
3.1. SÉRIE E TRANFORMADA DE FOURIER
255
É importante registrar que (3.59) é a derivada de (3.62) em relação a variável t. De modo análogo, (3.59) é a derivada de (3.63), também, em relação a variável t. Pensando bem, não poderia ser diferente, pois a função delta de Dirac é a derivada, no ponto t = 0, da função de Heaviside. Por isso, é costume se escrever dh+ (t) /dt = f (t), em que o sistema linear causal invariante no tempo é especificado por f (t). A essa altura, não há dúvida da importância da função de Heaviside na teoria das séries e transformadas de Fourier. A função de Heaviside, denotada de H (t) , é também conhecida como função degrau unitário positivo ou simplesmente função degrau unitário, sem o adjetivo positivo. É por isso que o Mathematica reconhece a fumção de Heaviside como UnitStep[expr]. A função de Heaviside possui uma irmã gêmea. É a função definida por 1 − H (t), conhecida como função degrau unitário negativo. O adjetivo negativo é indispensável, pois ele serve para distinguir o degrau unitário negativo do degrau unitário positivo, ou seja, da função de Heaviside 30 . Devido a relevância do degrau unitário negativo em eletromagnetismo é conveniente determinar a resposta h− (t) do sinal 1 − H (t) a um sistema f (t) causal e invariante no tempo. Procedendo como no caso da função de Heaviside, podemos escrever, Z ∞ [1 − H (t − τ )] f (τ ) dτ h− (t) = −∞ Z t Z ∞ f (τ ) dτ − f (τ ) dτ , = 0
0
que, em virtude de (3.61) e (3.62), se reduz a h− (t) = h+ (∞) − h+ (t) = Re fb(0) − h+ (t) .
Substituindo (3.62) e (3.63) nesta identidade, obtém-se, respectivamente, 2 h (t) = − π −
Z
0
∞
Im fb(ω) cos ωtdω ω
(3.64)
30 A função de Heaviside serve, por exemplo, para representar uma corrente elétrica constante na antena do transmissor eletromagnético após este ter sido acionado. O degrau unitário negativo, por sua vez, representa exatamente o oposto, o corte instantâneo da corrente na antena do transmissor. No tratamento de efeitos transientes eletromagnéticos, que serão realizados no décimo capítulo, usaremos constantemente os dois tipos de funções degraus.
256
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR
e 2 h (t) = Re fb(0) − π −
Z
0
∞
Re fb(ω) sin ωtdω ω
(3.65)
Os sobrescritos + e − em h+ (t) e h− (t) servem para identificar as respostas dos degraus unitário positivo e negativo, respectivamente. a um sistema linear causal.
3.1.6
Transformadas Seno e Co-seno
É oportuno, nesse momento, rever sucintamente o que foi visto sobre séries e transformadas de Fourier neste segundo capítulo. Iniciamos com as funções periódicas e as séries de Fourier. O espectro de uma função periódica é una função discreta. Em outras palavras, o espectro de uma função periódica é definido apenas em pontos isolados da reta.. Se a função for não-periódica não faz sentido falar em série de Fourier. Mas, se a função não-periódica for definida num intervalo finito é possível ainda lançar mão das séries de Fourier. Para isso, constrói-se uma função periódica tendo como período o dobro do intervalo de definição da função. A extensão periódica assim construída resulta numa função periódica par ou ímpar, conforme a simetria ditada pelo problema a ser resolvido. Apenas a aproximação da função pela série de Fourier (seno ou co-seno) dentro do semi-período (intervalo de definição da função) é de interesse, o resto, serve apenas como suporte para a expansão periódica da função e, conseqüentemente, pode ser totalmente descartado31 . Se o domínio da função não-periódica for de − ∞ a + ∞, as séries de Fourier dão lugar às transformadas de Fourier. Neste caso, o espectro da função deixa de ser discreto (enumerável) e torna-se contínuo (não enumerável) e por conseguinte ele passa a ser definido em todos os pontos da reta. Em síntese, séries e transformadas de Fourier só se aplicam a funções definidas em toda reta. As funções definidas num intervalo finito precisam ser expandidas de forma periódica em toda reta, antes de serem aproximadas por séries de Fourier. O leitor atento deve ter observado que as funções definidas de 0 a + ∞ ainda não foram contempladas. De fato, elas não se enquadram em nenhum caso anterior. Mas, isto não é problema. É só estender a função para toda reta rebatendo-a em torno do ponto t = 0.O rebatimento pode ser simétrico ou anti-simétrico, resultando numa função par ou ímpar, conforme o caso. Feito o rebatimento, a função passa a ser 31 A expansão em toda reta lembra a "barriga de aluguel". Nascida a criança (a aproximação da função no seu intervalo de definição) a barriga de alugel não tem mais finalidade.
3.1. SÉRIE E TRANFORMADA DE FOURIER
257
definida em toda reta.e assim podem-se usar as transformadas de Fourier. Funções definidas no interval (−∞, 0) serão tratadas da mesma maneira. Sem perder a generalidade, vamos considerar f (t) como sendo uma função real definida em t ≥ 0. Fazendo-se f (−t) = f (t) obtém-se uma função par. Assim, a integral (3.27) se reduz a Z ∞ Z ∞ ˆ f (t) cos ωtdt = 2 f (t) cos ωtdt, fc (ω) = =∞
=∞
e a integral (3.28) em Z ∞ Z 1 ∞ ˆ 1 ˆ fc (ω) cos ωtdω = fc (ω) cos ωtdω, f (t) = 2π −∞ π 0 em virtude de fˆc (−ω) = fˆc (ω) . Motivados por estas duas integrais, vamos definir a transformada co-seno da função real f (t) da seguinte maneira, Data uma função real f (t), sendo t ≥ 0, a sua transformada co-seno Fc [f (t)] é definida pela integral fˆc (ω) =
Z
∞
f (t) cos ωtdt
(3.66)
0
e a transformada inversa co-seno F−1 c [f (t)], por Z 2 ∞ ˆ fc (ω) cos ωtdω. f (t) = π 0
(3.67)
Em vez de se fazer f (−t) = f (t) seria igualmente válido considerar f (−t) = −f (t). Neste caso a função rebatida seria uma função impar e a integral (3.37) se reduziria a Z ∞ Z ∞ ˆ f (t) sin ωtdt = −2 f (t) sin ωtdt, fs (ω) = =∞
=∞
e a integral (3.28), por sua vez, se reduziria a Z ∞ Z 1 1 ∞ ˆ ˆ f (t) = fs (ω) sin ωtdω = fs (ω) sin ωtdω, 2π −∞ π 0 em virtude de fˆs (−ω) = −fˆs (ω)
258
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR
Do mesmo modo como na transformada co-seno, define-se a partir destas duas integrais, a transformada seno da seguinte maneira. Data uma função real f (t), sendo t ≥ 0, a sua transformada seno Fs [f (t)] é definida pela integral fbs (ω) =
Z
∞
f (t) sin ωtdt
(3.68)
0
e a transformada inversa seno F−1 s [f (t)] pela integral Z ∞ 2 f (t) = fbs (ω) sin ωtdω. π 0
(3.69)
Afirmamos acima que não há perda de generalidade em considerar a função f (t) como sendo real. De fato, se f (t) for complexa, a sua transformada co-seno é dada pelas transformadas co-seno das componentes real e imaginária calculadas separadamente. O mesmo raciocínio se aplica à transformada seno de uma função complexa. Note que a constante 1/2 anteposta à transformada inversa de Fourier foi transferida, arbitrariamente, para as transformadas diretas seno e coseno. Esta é a convenção usada em matemática ([31], [?]). É bom saber que o Mathematica não adota esta convenção. A mesma regra usada nas transformadas de Fourier é aplicada também às transformadas seno e coseno. Vamos agora analisar dois exemplos com o Mathematica. O primeiro, com a transformada co-seno FourierCosTransform[expr] e segundo com a transformada seno FourierSinTransform[expr]. Exemplo 3.29: Dada a função f (t) = t2 e−t , t ≥ 0, calcular, via Mathematica, a transformada co-seno. In[1]:= (*--- Exemplo 2.92:
Transformada co-seno -*)
Clear[t,w] FourierCosTransform[t^2Exp[-t], t, w, FourierParameters -> {1, -1}]/2 Out[2]= (2 − 6w2 )/(1 + w2 )3
Exemplo 3.30: Calcular a transformada inversa co-seno do resultado anterior.
3.1. SÉRIE E TRANFORMADA DE FOURIER In[3]:= (*--- Exemplo 2.93:
259
Transformada inversa co-seno -*)
2InverseFourierCosTransform[%, w, t, FourierParameters -> {1, -1}] // FullSimplify Out[3]= e−t t2
Exemplo 3.31: Dada a função f (t) = t3 e−t , t ≥ 0, calcular, via Mathematica, a transformada seno. In[4]:= (*--- Exemplo 2.94:
Transformada seno -*)
Clear[t,w]I FourierSinTransform[t^3Exp[-t], t, w, FourierParameters -> {1, -1}]/-2 Out[5]= −24w(−1 + w2 )/(1 + w2 )4
Exemplo 3.32: Calcular a transformada inversa seno do resultado anterior. In[6]:= (*--- Exemplo 2.95:
Transformada inversa seno -*)
-2InverseFourierSinTransform[%, w, t, FourierParameters -> {1, -1}] // FullSimplify Out[6]= e−t t3
Observe a presença do fator 1/2 nas transformadas co-seno e seno e o fator −2/1 nas transformadas inversas, de acordo com as observações feitas há pouco.
3.1.7
Transformadas e Séries Multiplas de Fourier
Nesta seção faremos um breve resumo sobre transformadas e séries múltiplas de Fourier que serão aplicadas no quarto e no quinto capítulos. Iniciaremos discutindo as transformadas e em seguida as séries. Transformadas dupla e tripla de Fourier A definição da transformada de Fourier de funções de uma variável pode ser facilmente estendida para duas e três dimensões. Em duas dimensões, o par de transformadas é definido do seguinte modo:.
260
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR
Data uma função f (x, y) real ou complexa, com x e z reais, a transformada dupla de Fourier F [f (x, y)] é definida pela integral: b fˆ (kx , ky ) =
Z
∞
−∞
Z
∞
−∞
A transformada inversa de Fourier 1 f (x, y) = (2π)2
Z
∞
−∞
Z
f (x, y) e−i(kx x+ky y) dxdy.
∞
−∞
F−1
(3.70)
¸ ∙ bˆ f (kx , ky ) é definida pela integral:
b fˆ (kx , ky ) ei(kx x+ky y) dkx dky .
(3.71)
Com a mesma simplicidade de antes, o Mathematica resolve transformadas diretas e inversas duplas de Fourier. Para tanto, basta reiterar duas vezes as funções FourierTransform[expr] e InverseFourierTransform[expr], como bem ilustram os exemplos a seguir. Exemplo 3.33: Calcular as transformadas direta e inversa duplas de Fourier da função: 2 2 f (x, y) = e−(x + y ) In[1]:= (*--- Exemplo 2.96:
Transformada direta dupla de Fourier da
função f(x,y) -*) Clear[x, y, kx, ky] FourierTransform[FourierTransform[Exp[-(x^2 + y^2)], Clear[x, y, kx, ky] FourierTransform[FourierTransform[Exp[-(x^2 + y^2)], x, kx, FourierParameters -> {1,-1}], y, ky, FourierParameters -> {1,-1}] 2
2
Out[2]= e1/4(−kx −ky ) π In[3]:= (*--- Exemplo 2.96:
Transformada inversa dupla de Fourier da
da função f(x,y) ---*) InverseFourierTransform[InverseFourierTransform[%, x, kx, FourierParameters -> {1,-1}], y, ky, FourierParameters -> {1,-1}] Out[4]= e−x
2
−y 2
3.1. SÉRIE E TRANFORMADA DE FOURIER
261
Exemplo 3.34: O Mathematica trata funções generalizadas de mais de uma dimensão com a mesma simplicitade com que calcula as unidimensionais. Com efeito, as transformadas direta e inversa duplas de Fourier das funções f (x, y) = 1 e g (x, y) = δ (x − x0 ) δ (y − y0 ) são: In[4]:= (*--- Exemplo 2.97:
Transformada direta dupla de Fourier da
da função f(x, y) ---*) Clear[x, y, kx, ky] FourierTransform[FourierTransform[1, x, kx, FourierParameters -> {1,-1}], y, ky, FourierParameters -> {1,-1}] Out[5]= 4π2 DiracDelta[kx] DiracDelta[ky] In[6]:= (*--- Exemplo 2.97:
Transformada inversa dupla de Fourier da
da função f(x, y) ---*) InverseFourierTransform[InverseFourierTransform[%, kx, x, FourierParameters -> {1,-1}], ky, y,FourierParameters -> {1,-1}] Out[6]= 1 In[7]:= (*--- Exemplo 2.97:
Transformada direta dupla de Fourier da
da função g(x, y) ---*) Clear[x0, y0, x, y, kx, ky] FourierTransform[FourierTransform[ DiracDelta[x - x0] DiracDelta[y - y0], x, kx, FourierParameters -> {1,-1}], y, ky, FourierParameters -> {1,-1}] Out[8]= e−ikx x0 +iky y0 In[9]:= (*--- Exemplo 2.97:
Transformada inversa dupla de Fourier da
da função g(x, y) ---*) InverseFourierTransform[InverseFourierTransform[%, kx, x, FourierParameters -> {1,-1}], ky, y,FourierParameters -> {1,-1}] Out[9]= DiracDelta[x − x0 ] DiracDelta[y − y0 ]
De modo interamente análogo, define-se a transformada tripla de Fourier b f (kx , ky , kz ) da função f (x, y, z). Simplesmente, as integrais duplas (3.70) e (3.71) dão lugar às integrais triplas, e pronto!. Assim,
262
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR
Data uma função f (x, y, z) real ou complexa, com x, y e z reais, a transformada tripla de Fourier F [f (x, y, z)] é definida pela integral: b b fˆ (kx , ky , kz ) =
Z
∞
−∞
Z
∞
−∞
Z
∞
f (x, y, z) e−i(kx x+ky y+kz z) dxdydz.
−∞
A transformada inversa de Fourier tegral: f (x, y, z) =
1 (2π)3
Z
∞
−∞
Z
∞
−∞
Z
∞
−∞
F−1
(3.72)
¸ ∙ b bˆ f (kx , ky , kz ) é definida pela in-
b b fˆ (kx , ky , kz ) ei(kx x+ky y+kz z) dkx dky dkz .
(3.73)
Reiterando pela terceira vez a função FourierTransform[expr] e a sua inversa, InverseFourierTransform[expr], consegue-se calcular facilmente as transformadas direta e inversa triplas de Fourier. Vejamos, então, alguns exemplos. Exemplo 3.35: Calcular com o Mathematica as transformadas direta e inversa triplas de Fourier da função: 2 +y 2 +z 2
f (x, y, z) = ex
In[10]:= (*--- Exemplo 2.98: Transformada direta tripla de Fourier da função f(x,y,z) ---*) Clear[x, y, z, kx, ky, kz] FourierTransform[FourierTransform[FourierTransform[ Exp[-(x^2 + y^2 + z^2)], x, kx, FourierParameters -> {1,-1}], y, ky, FourierParameters -> {1,-1}], z, kz, FourierParameters -> {1,-1}] 2 2 2 Out[11]= e1/4(−kx −ky −kz ) π3/2 In[12]:= (*--- Exemplo 2.98: Transformada direta tripla de Fourier da função f(x,y,z) ---*) InverseFourierTransform[InverseFourierTransform[ InverseFourierTransform[%,
3.1. SÉRIE E TRANFORMADA DE FOURIER
263
kx, x, FourierParameters -> {1,-1}], ky, y, FourierParameters -> {1,-1}], kz, z, FourierParameters -> {1,-1}] Out[12]= e−x
2 −y 2 −z 2
Exemplo 3.36: Calcular com o Mathematica as transformadas direta e inversa triplas de Fourier da função: 2 +2y 2
f (x, y, z) = ex
In[13]:= (*--- Exemplo 2.99:
Transformada direta tripla de Fourier
da função f(x,y,z) ---*) Clear[x, y, z, kx, ky, kz] FourierTransform[FourierTransform[FourierTransform[ Exp[-(x^2 + 2 y^2)], x, kx, FourierParameters -> {1,-1}], y, ky, FourierParameters -> {1,-1}], z, kz, FourierParameters -> {1,-1}] √ 1/8 (−2 k2 −k2 ) 2 x y π DiracDelta[kz] Out[14]= 2e In[15]:= (*--- Exemplo 2.99:
Transformada inversa tripla de Fourier
da função f(x,y,z) ---*) InverseFourierTransform[InverseFourierTransform[ InverseFourierTransform[%, kx, x, FourierParameters -> {1,-1}], ky, y, FourierParameters -> {1,-1}], kz, z, FourierParameters -> {1,-1}] Out[15]= e−x
2 −2 y 2
Séries duplas de Fourier Em muitas situações, deparamos com a questão importante de como aproximar, por séries de senos e co-senos, funções de duas variáveis em regiões retangulares limitadas do plano. Naturalmente, não se pode usar transformadas duplas de Fourier, visto que o domínio da função, por hipótese, é limitado. Então, o que fazer? Acompanhando a mesma linha de raciocínio usada anteriormente para aproximar, por séries de Fourier, funções de uma variável, definidas num intervalo finito, podemos proceder da seguinte maneira:. Faz-se a expansão
264
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR
da função, que se deseja aproximar, em uma função periódica cujos períodos nas direções x e y são iguais a duas vezes estas duas quantidades, e usa-se o desenvolvimento das séries duplas de Fourier. Mas, o que é uma série dupla de Fourier? É a generalização natural da série de Fourier de funções de uma só variável. Dito isto, a partir das expressões (3.20) e (3.21) define-se a série dupla de Fourier de uma função de duas variáveis da seguinte maneira. Dada uma função periódica f (x, y) cujos períodos nas direções x e y são, respectivamnente, Lx e Ly , define-se a série dupla de Fourier de f (x, y) seguinte maneira. f (x, y) =
∞ ∞ X X
cmn ei2π(mx/Lx +ny/Ly ) ,
(3.74)
m=1 n=1
em que os coeficientes cnm de Fourier são expressos por Z Lx Z Ly 1 f (x, y) e−i2π(mx/Lx +ny/Ly ) dxdy. cmn = Lx Ly 0 0
(3.75)
Veremos mais adiante que na maioria dos problemas práticos de eletromagnetismo a função periódica f (x, y) representa potenciais elétricos ou magnéticos com certo grau de simetria. Por isso é conveniente reescrever as equações (3.74) e (3.75) de modo a explorar, ao máximo, a simetria que acompanha o problema. O caso mais comum é quando f (x, y) é uma função ímpar nas duas direções. Nesse caso,.as fórmulas (3.74) e (3.75) se reduzem a f (x, y) =
∞ ∞ X X
bmn sin (2πmx/Lx ) sin (2πny/Ly )
(3.76)
m=1 n=1
bmn =
1 Lx Ly
Z
0
Lx
Z
Ly
f (x, y) sin (2πmx/Lx ) sin (2πny/Ly dxdy) (3.77)
0
É óbvio que se a função f (x, y) for par nas duas direções, no lugar dos senos teríamos co-senos nas expressões (3.76) e (3.77). Se, por outro lado, a função for par numa direção e ímpar na outra teríamos co-seno e seno ou seno e co-seno, conforme o caso. Para fixar essas idéias, vejamos alguns exemplos que servem para mostrar como o Mathematica calcula séries duplas de Fourier a partir das séries de uma só variável.
3.1. SÉRIE E TRANFORMADA DE FOURIER
265
Exemplo 3.37: Dada a função periódica f (x, y) = x2 y em que Lx = Ly = 4, calcular os doze primeiros termos da série dupla de Fourier. In[1]:= (*--- Ativa o pacote Add On: Calculus‘FourierTransform‘ ---*) {-1, 1/4}], y, 3, FourierParameters -> {-1, 1/4}] // Expand Out[3]= 16 sin[πy/2]/(3π) − 64 cos[πx/2] sin[πy/2]/π 3 + 16 cos[πx] sin[πy/2]/π3 − 64 cos[3πx/2] sin[πy/2]/(9π3 )−
8 sin[πy]/(3π) + 32 cos[πx/2] sin[πy]/π 3 − 8 cos[πx] sin[πy]/π 3 + 32 cos[3πx/2] sin[πy]/(9π 3 )+ 16 sin[3πy/2]/(9π) − 64 cos[πx/2] sin[3πy/2]/(3π 3 )+ 16 cos[πx] sin[πy]/(3π 3 ) − 64 cos[3πx/2] sin[3πy/2]/(27π 3 )
A função f (x, y) = x2 y é o produto de uma função par na direção x por uma função ímpar na direção y. Assim, a série dupla de Fourier é equivalente ao produto das séries de cada uma das duas funções fp (x) = x2 e fi (y) = y. O próximo exemplo esclarece esta afirmativa. Exemplo 3.38 Vamos repetir o exemplo anterior calculando o produto das séries de Fourier das funções fp (x) = x2 e fi (y) = y. In[4]:= (*--- Exemplo 2.101:
Série de Fourier da
do produto das funções fp(x) e fi(y)-*) Clear[x, y] FourierTrigSeries[x^2, x, 3, FourierParameters -> {-1, 1/4}]* FourierTrigSeries[y, y, 3, FourierParameters -> {-1, 1/4}] // Expand Out[5]= 16 sin[πy/2]/(3π) − 64 cos[πx/2] sin[πy/2]/π 3 + 16 cos[πx] sin[πy/2]/π3 − 64 cos[3πx/2] sin[πy/2]/(9π3 )−
8 sin[πy]/(3π) + 32 cos[πx/2] sin[πy]/π 3 − 8 cos[πx] sin[πy]/π 3 + 32 cos[3πx/2] sin[πy]/(9π 3 )+ 16 sin[3πy/2]/(9π) − 64 cos[πx/2] sin[3πy/2]/(3π 3 )+ 16 cos[πx] sin[πy]/(3π 3 ) − 64 cos[3πx/2] sin[3πy/2]/(27π 3 )
266
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR
Os coeficientes da série dupla de Fourier de uma função de duas variáveis formada pelo produto de funções de uma única variável é fácil de ser calculados com o Mathematica. Vejamos um exemplo: Exemplo 3.39 Calcular os doze primeiros coeficientes da série dupla de Fourier do exemplo anterior. In[6]:= (*--- Exemplo 2.102: Coeficientes da série dupla de Fourier do exemplo anterior -*) Clear[x, y] Flatten[Outer[Times, Table[FourierSinCoefficient[y, y, n, FourierParameters -> {-1, 1/4}], {n, 1, 3}], Table[FourierCosCoefficient[x^2, x, m, FourierParameters -> {-1, 1/4}], {m, 0, 3}]]] Out[7]= {16/(3 π), −64/π3 , 16/π3 , −64/(9π3 ), −8/(3 π), 32/π 3 , −8/π3 , 32/(9π3 ), 16/(9 π), −64/(3π 3 ), 16/(3π 3 ), −64/(27π3 )}
No início dessa subseção abordamos a questão de como aproximar funções definidas numa região retangular limitada do plano, por funções trigonométricas. Foi dito que isto pode ser feito fazendo-se a expansão periódica da função e aplicar as séries duplas de Fourier. A expansão periódica é feita tomando como períodos Lx e Ly , duas vezes as dimensões x e y do domínio retangular. Em princípio, a função periódica resultante da expansão pode ser par ou ímpar em ambas direções ou par em uma direção e ímpar na outra. O caso mais comum, como veremos no capítulo quatro, é a expansão ímpar nas duas direções. A título de ilustração vamos fazer o desenvolvimento trigonométrico da função f (x, y) = 1 definida no retângulo 0 < x < 2 e 0 < y < 2. Para isso vamos construir a função periódica ímpar fxy (x, y) = fx (x) fy (y) cujas funções fx (x) e fy (y) são definidas por ( −1 −2 {FontSize -> 7.0}, PlotLabel -> txt, DisplayFunction -> Identity]] In[12]:= (*--- Figura 3.33:
Traça os graficos da serie dupla
de Fourier de sign[x]sign[y] ---*) Show[GraphicsArray[{{plotSerieDupla[0, 0],
3.1. SÉRIE E TRANFORMADA DE FOURIER 1 termo
3 termos
1 0 -1 -2
1 0 -1 -2
2 1 0 -1
2 1 0 -1
-1
0 1
-1
0 1
2 -2
11 termos
2 1 0 1
1 0.5 0 -0.5 -1 -2
2 1 0 -1
-1
0
2 -2
101 termos
1 0.5 0 -0.5 -1 -2 -1
269
-1
0 1
2 -2
2 -2
Figura 3.33: Aproximação da fun ção sign(x)sign(y) por soma de senos nas dire ções x e y com 1, 3, 11 e 101 termos. plotSerieDupla[1, 1]}, {plotSerieDupla[5, 5], plotSerieDupla[50, 50]}}], DisplayFunction -> $DisplayFunction];
Há pouco, afirmamos que em muitas situações aparece a necessidade de se aproximar, por senos ou co-senos, funções de duas variáveis definidas em regiões retangulares finitas do plano. O próximo exemplo é uma boa ilustração disto.. Exemplo 3.42 Desenvolver a função não periódica: ¸ ∙ sinh (x/2π) x − ,....0 < x < 2π, f (x, y) = 100y 2π sinh 1
0 {-1, 1/2}] // Expand // Chop;
3.1. SÉRIE E TRANFORMADA DE FOURIER
271
(a)
(b)
10
10
5
1
0 -5 -10
0.5
5 0 -5 -10
0.5
0
-5
0
-5 -0.5
0 5
0
-0.5 5
-1
Figura 3.35: (a) Gráfico da função f (x, y) no retângulo 0 < x < 2π, 0 < y < 1. (b) Gráfico da soma dos cinqüenta primeiros termos da série dupla de Fourier (senos) de f (x, y). O gráfico (a) da Figura (3.35) mostra a função f (x, y) no retângulo 0 < x < 2π, 0 < y < 1 e o gráfico (b) representa a soma dos cinqüenta primeiros termos da série dupla de Fourier. Visualmente não há nenhuma diferença entre ambos. In[12]:= (*--- Figura 3.35:
Gráficos:
(a) Função f(x, y), (b) série
dupla de Fourier da expansão ímpar de f(x, y) ---*)
Como a função f (x, y) é o produto de duas funções, fx (x) e fy (y), separadas em x e y, a sua série dupla de Fourier (seno) é equivalente ao produto das séries unidimensionais de fx (x) e fy (y), individualmente. Com efeito: In[12]:= (*--- Exemplo 3.42: Produto das séries de Fourier de funX(x) por funY(y) -- -*) {nN, nM} = {5, 10}; funX[x_] := 100.(x/(2 Pi) - Sinh[x/(2 Pi)]/Sinh[1]) funY[y_] := y serieDuplaXYdeFourier = FourierTrigSeries[funX[x], x, nN, FourierParameters -> {-1, 1/(4 Pi)}]* FourierTrigSeries[funY[y], y, nM, FourierParameters -> {-1, 1/2}] // Chop;
272
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR
(a)
(b)
10 5 0 -5 -10
1 0.5 0
-5
10 5 0 -5 -10
0.5 0
-5
-0.5
0 5
0
-0.5 5
-1
Figura 3.36: O gráfico (a) da Figura (3.36) mostra, mais uma vez, a função f (x, y) e o gráfico (b) representa a soma do produto dos cinco primeiros termos da série de Fourier de fx (x) pelos dez primeiros.termos da série de Fourier de fy (y). Note que visualmente não ha nenhuma diferença entre as Figuras (3.35) e (3.36). In[12]:= (*--- Figura 3.36:
Grafícos :
(a) função f(x, y),
(b) produto das séries de Fourier de funX(x) por funY(y) ---*)
Uma terceira alternativa é calcular os coeficientes de Fourier das funções fx (x) e fy (y) e aplicar ipsis litteris a definição da série dupla de Fourier. Com outras palavras, multiplicam-se os senos (harmônicos) pelos coeficientes e efetua-se as somas nas duas direções. É só isso! Esta é a metodologia que se usa em grande parte dos problema práticos. Entretanto, vale uma ressalva. A metodologia só é valida se a função de duas variáveis for separável em duas funções de um única variável. De qualquer maneira, continua sendo o caso mais comum na prática. Então, vamos aos fatos: In[12]:= (*--- Exemplo 3.42:
Série de Fourier de f(x, y) desenvolvida
a partir dos coeficientes an e am ---*) {nN, nM} = {5, 10}; funX[x_] := 100.(x/(2 Pi) - Sinh[x/(2 Pi)]/Sinh[1]) funY[y_] := y an = Table[FourierSinCoefficient[funX[x], x, n,
3.1. SÉRIE E TRANFORMADA DE FOURIER (a)
273 (b)
10 5 0 -5 -10
1 0.5
10 5 0 -5 -10
0
-5
0.5 0
-5
-0.5
0 5
0
-0.5 5
-1
Figura 3.37: (a) Gráfico da função f (x, y). (b) Gráfico da soma dos cinqüenta primeiros termos da série de Fourier calculada diretamente com os coeficientes de Fourier de fx (x) e de fy (y) individualmente. FourierParameters -> {-1, 1/(4 Pi)}], {n, nN}]; am = Table[FourierSinCoefficient[funY[y], y, m, FourierParameters -> {-1, 1/2}], {m, nM}]; serieDuplaSumFourier = Sum[Sum[am[[m]] Sin[m Pi y], {m, nM}]*an[[n]] Sin[n x/2], {n, nN}];
O gráfico (a) da Figura (3.37) mostra a função f (x, y) e o gráfico (b) representa os cinqüenta primeiros termos da série de Fourier calculada diretamente com os coeficientes de Fourier de fx (x) e de fy (y) individualmente. É claro que se a função de duas variáveis não poder ser desdobrada em duas funções de uma variável,.então não se pode tirar vantagem desta estratégia. Neste caso, deve-se usar a série dupla de Fourier na sua generalidade. In[12]:= (*--- Figura 3.37:
Grafícos :
(a) função f(x, y),
(b) Série de Fourier de f(x, y) desenvolvida a partir dos coeficientes an e am ---*)
Tudo que foi dito até agora com respeito às séries duplas de Fourier (seno) pode ser facilmente adaptado às séries triplas de Fourier (seno). Basta acrescentar mais uma variável e substituir samatórios e integrais duplos por somatórios e integrais triplos, de acordo com:. .
274
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR
f (x, y, z) =
∞ X ∞ ∞ X X
bmnl sin (2πmx/Lx ) sin (2πny/Ly ) sin (2πlz/Lz )
m=1 n=1 n=1
bmnl em que
1 = Lx Ly Lz
Z
0
Lx
Z
0
Ly
Z
(3.80) Lz
f (x, y, z) K (x, u, z) dxdydz
(3.81)
0
K (x, u, z) = sin (2πmx/Lx ) sin (2πny/Ly ) sin (2πlz/Lz ) Aplicando o mesmo raciocínio, é fácil definir série tripla de Fourier tipo co-seno ou mesmo generalizar para séries triplas envolvendo simultaneamente senos e co-senos. No tocante ao Mathematica, não há muita diferença entre série dupla e série tripla de Fourier. É uma questão apenas de acrescentar alguns poucos comandos ligados à terceira dimensão e o resto é tudo igual.
3.1.8
Transformmada de Fourier Discreta (TFD)33
Até aqui, tudo que foi discutido sobre série e transformada de Fourier pressupõe que se conheça a expressão algébrica da função que se deseja transformar. No dia-a-dia, isto nem sempre é possível. No mais das vezes, as informações sobre uma determinada função são restritas a valores isolados, sejam provenientes de observações experimentais, seja na forma de números gerados por computadores. Via de regra, essas informações provém de processos complexos que nem sempre podem ser traduzidos em fórmulas matemáticas exatas. Em vista disto, é preciso adaptar a teoria clássica das transformadas de Fourier a esta nova realidade34 . A transformada de Fourier de uma função formada por pontos isolados é denominada de Transformada de Fourier Discreta ou simplesmente TFD. É um assunto bem especializado. Por isso, vamos nos restringir a alguns exemplos que serão usados nos próximos capítulos. O leitor interessado no assunto deve consultar a literatura [12], [43], [55], [72], [73]. É bem verdade que a teoria da TFD é um assunto amplo e especializado, 33 O conteúdo desta subseção será utilizado a partir do oitavo capítulo. O leitor, se assim desejar, pode adiar a leitura até aquele capitulo. 34 Hoje vivemos num mundo tecnológico digital. Computador, telefone celular, TV digital, fotografia digital, CD-ROM, GPS, prospecção de petróleo, tomografia médica, estudo do cosmo, previsões meteorológicas, lingüística, música, para citar apenas alguns exemplos, dependem essencialmente da análise de Fourier de sinais discretos.
3.1. SÉRIE E TRANFORMADA DE FOURIER
(1) (2) (3) (4)
Domínio do tempo Não-periódica e contínua Periódica e contínua Não-periódica e discreta Periódica e discreta
275
Domínio da freqüência Contínua e não-periódica Discreta e não-periódica Contínua e periódica Discreta e periódica
Tabela 3.1: Transformadas direta e inversa de Fourier como já disse, contudo a idéia central é muito simples. A Tabela 3.1 resume, em quatro linhas e duas colunas o cerne da transformada de Fourier discreta. A primeira linha da Tabela 3.1 se refere à transformada de Fourier de uma função não-periódica e contínua35 . É claro que no domínio da freqüência, a função é não-periódica também, pela própria definição da transformada de Fourier. A segunda linha corresponde à série de Fourier como um caso particular da transformada de Fourier. O fato de a função ser periódica no domínio do tempo implica que ela seja discreta no domínio da freqüência. Se se deseja que a função seja periódica no domínio da freqüência é preciso que ela seja discreta no domínio do tempo, como indica a terceira linha. Ademais, a não periodicidade da função no domínio do tempo leva a função ser contínua no domínio da freqüência. Finalmente, para que a função seja discreta nos domínios do tempo e da freqüência simultaneamente é necessário que ela seja também periódica nos dois domínios. É exatamente o que nos diz a quarta linha da tabela. Resumindo: periodicidade num domínio implica em digitalização no outro domínio. A Transformada de Fourier Discreta se enquadra exatamente na quarta linha da Tabela 3.1. Entram números no computador e saem números do computador. Isto significa que os dados de entrada e de saída devem ser periódicos. Todo o mistério da TFD está em saber, precisamente, como se deve proceder com a entrada de dados no computador na forma discreta e como interpretar os dados de saída. Os diagramas da Figura 3.38 reforçam ainda mais as informações esquematizadas na Tabela 3.1. De fato, tanto a figura quanto a tabela contém quatro linhas e duas colunas. A primeira linha da figura mostra os diagramas de uma função não-periódica nos domínios do tempo e da freqüência. Para que o espectro se apresente digitalizado é preciso que a função seja periódica no domínio do tempo. É esta a mensagem dos diagramas da segunda linha da figura. Na terceira linha, a digitalização da função no domínio do tempo 35
A rigor deveríamos usar o termo função contínua por partes visto que a função pode deixar de ser contínua em alguns pontos isolados do intervalo de definição. Por outro lado uma função discreta toma valores apenas em pontos isolados do intervalo.
276
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR
acarreta periodicidade no domínio da freqüência. Finalmente, a quarta linha da figura resume tudo: periodicidade num domínio implica digitalização no outro domínio36 . O gráfico do lado esquerdo da Figura 3.39 destaca um período do diagrama do lado esquerdo da primeira linha da Figura 2.39. Do mesmo modo, no lado direito da mesma figura, tem-se um período do espectro da função, ou seja, o diagrama do lado direito da primeira linha da Figura 3.38. Nota-se que foram selecionados N pontos de entrada e de saída, cobrindo um período completo, ambos iniciando no ponto zero. Estes são os períodos fundamentais de amostragem .Os exemplos que veremos a seguir esclarecerão a Figura 3.39 e vice-versa. Mas antes, é preciso falar um pouco sobre o algoritmo FFT (Fast Fourier Transform) que calcula de modo extremamente eficiente transformadas de Fourier discretas. Levando-se em consideração que ω = 2πf , podemos enunciar a TFD nos seguintes termos:. Seja f (k∆T ) uma função discreta, definida nos pontos equidistantes 0, ∆T, 2∆T, a transformada de Fourier ¢ ...k∆T, ...(N − 1)∆T . Define-se 37 ¡ 3∆T, n b discreta f NT de f (k∆T ), da seguinte maneira : fb
³
N−1 X n ´ = ∆T f (k∆T ) e−i2πnk/N N ∆T n=0
k = 0, 1, 2...N − 1.
(3.82)
¡ n ¢ Note-se que fb N∆T é uma função discreta definida nos pontos isolados: 1 2 3 n N −1 , ... N∆T . 0, N∆T , N∆T , N ∆T , ... N∆T Analogamente, tem-se a transformada inversa de Fourier discreta: f (k∆T ) =
N−1 1 X b³ n ´ i2πnk/N f e N ∆T n=0 N ∆T
k = 0, 1, 2...N − 1.
(3.83)
É conveniente reescrever (3.82) e (3.83) numa forma mais compacta. Assim, 36
Tanto na tabela quanto nos gráficos usamos os termos: domínio do tempo e domínio da freqüência. Nem sempre a variável independente da função é tempo. Na verdade, ela pode ser uma distância cartesiana, por exemplo x. Neste caso é preferível dizer "no domínio x" que "no domínio do tempo"e "no domínio de número de onda"no lugar de "domínio da freqüência". 37 Pensando bem, esta definição nada mais é do que a regra trapezoidal aplica à equação ??.
3.1. SÉRIE E TRANFORMADA DE FOURIER
277
g(t)
G(f )
(1) f
t g(t)
G(f )
(2) f
t g(t)
G(f )
(3) f
t g(t)
G(f )
(4) f
t
Figura 3.38: Periodicidade implica digitalização e vice-versa.
g(n) G(n) Ponto onde começa novo período
N
2
N
1
2
T
Ponto onde começa novo período
n Tempo
N
2
N
1
2
1
1
F
T
F
Figura 3.39: Períodos rebatidos do sinal e da TFD.
n Freqüência
278
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR
vk =
N−1 X
un e−i2πnk/N
n=0
N−1 1 X uk = vn ei2πnk/N N n=0
k = 0, 1, 2...N − 1, k = 0, 1, 2...N − 1,
(3.84)
(3.85)
em que a seqüência vk é a transformada de Fourier discreta da seqüência uk . Note que o fator ∆T se auto-cancela entre as transformadas direta e inversa, por isso ele não aparece nas fórmulas 3.84 e 3.85. Afinal de contas, a constante ∆T é apenas um fator de escala que pode ser inserido ou não no final dos cálculos. Alguns autores nem incluem na definição da transformada inversa (3.85) o fator 1/N . Alegam que em muitos casos de aplicações de DFT este fator é irrelevante. O leitor deve estar atento a estes pormenores nas diferentes definições de DFT que existem por aí. É natural que a transformada de Fourier discreta seja apenas uma aproximação da transforma clássica de Fourier. É óbvio que quanto menor for o incremento ∆T , melhor será a aproximação. A diminuição de ∆T é acompanhada do aumento do número N de pontos de amostragem da função. Neste caso, o tempo de CPU aumenta concomitantemente. Normalmente, as aplicações práticas da TFD lidam com quantidades enormes de dados. Portanto, torna-se imprescindível a otimização do processo de cálculo, a fim de minimizar o tempo de CPU. A primeira iniciativa, é escolher o valor ótimo de ∆T. Há um teorema famoso, conhecido por teorema da amostragem ou teorema de Shannon, que garante que o valor ótimo de ∆T é dado por 1/(2fN ), em que fN , conhecida como freqüência de Nyquest, é a maior freqüência no espectro da função amostrada [12]. As expressões 3.84 e 3.85, na forma como estão apresentadas, são ainda inadequadas para se calcular TFD de modo eficiente no computador. Entretanto, com uma simples reorganização dessas expressões, explorando a propriedade de periodicidade da função exponencial é possível desenvolver algoritmos bastante eficientes. Um desses algoritmos é o famoso FFT (Fast Fourier Transform) [12]. Em princípio, o algoritmo FFT funciona com qualquer seqüência de números reais ou complexos. Contudo, a eficiência deste algoritmo é otimizada quando o comprimento da seqüência for uma potência inteira de base dois, N = 2n . As funções Fourier[expr] e InverseFourier[expr] do Mathematica implementam o algoritmo FFT de sequências numéricas reais e complexas
3.1. SÉRIE E TRANFORMADA DE FOURIER
279
com qualquer base38 . Estas funções são fáceis de serem utilizadas e extremamente eficientes mesmo quando as seqüências são demasiadamente longas. A seguir, veremos alguns exemplos ilustrativos em que se aplicam estas duas funções do Mathematica 39 . Exemplo 3.43: Computar a transformada de Fourier discreta do pulso GPR ⎧ 0, t < 0, ⎪ ⎪ ⎨ pGP R (t) = e−t/2 sin 2πt/3, 0 ≤ t ≤ 3, , ⎪ ⎪ ⎩ 0, t > 3. apresentado no Exemplo 3.24.
Observa-se na definição acima que a duração do pulso é igual a 3 unidades de tempo (digamos, 3 nanosegundos). Vamos, então, usar este valor para definir o período fundamental de amostragem do pulso. De posse do período, o próximo passo é escolher o incremento de amostragem da função. Neste exemplo, vamos usar N = 26 = 64 pontos de amostragem o que corresponde a um intervalo de amostragem igual a ∆T = 3/63. Em primeiro lugar, vamos acionar o Mathematica para computar a lista dos valores do pulso GPR nos pontos de amostragem. A codificação do pulso GPR já foi feita na página 236. Por questão de conveniência de cálculo vale a pena repetí-lo aqui. Então, 38 Isto significa que o número de pontos amostrados da função não precisa ser uma potência de dois. 39 Acompanhando o mesmo esquema da transformada de Fourier (vide página 211), o Mathematica apresenta as seguintes fórmulas gerais para as transformadas direta e inversa de Fourier discretas:
vk =
uk =
1 N (1−a)/2 1 N (1+a)/2
N [
un ei2πb(n−1)(k−1)/N
k = 1, 2...N,
n=1 N [
vn e−i2πb(n−1)(k−1)/N
k = 1, 2...N,
n=1
O Mathematica usa como padrão a = 0 e b = 1. Por outro lado, as fórmulas 3.82 e 3.83 correspondem a a = 1 e b = −1. Neste caso deve-se usar a opção FourierParameters -> {1, -1} nas funções Fourier[expr] e InverseFourier[expr]. A exemplo da nossa definição de DFT, o Mathematica também não inclui o fator 1/∆T √ . Também não inclui, ao contrário de nossa definição, o fator 1/N (na verdade, o fator 1/ N nas transformadas direta e inversa).
280
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR 0.8
0.6
0.4
0.2
10
20
30
40
50
60
-0.2
-0.4
Figura 3.40: Representação gráfica do pulso GPR digitalizado. In[1]:= (*--- Exemplo 3.43: Difinição do pulso GPR ---*) pulsoGPR[t_]:= Exp[-t/2] Sin[2 Pi t/3] UnitStep[t]* (1 - UnitStep[t - 3])
Agora é a vez de digitalizar do pulso GPR com 64 pontos eqüidistantes no intervalo [0, 3]: In[3]:= (*--- Exemplo 3.43: Digitalização do pulso GPR ---*) nP = 64; dataGPR = Table[pulsoGPR[t], {t, 0, 3, 3/(nP - 1)}]; In[5]:= (*--- Exemplo 3.43: Short[dataGPR, 4]
Lista dataGPR ---*)
Out[5]//Short= {0, 0.0957466, 0.186156, 0.270575, 0.348437, 0.419269, 0.482688, >, −0.166789, −0.142682, −0.11826, −0.0937806, −0.0694894, −0.0456196, −0.0223892}
A maneira mais simples de visualizar o comportamento dos dados digitados é através de gráficos, como ilustra a Figura 3.40. In[6]:= (*--- Exemplo 3.40: Gráfico do pulso GPR digitalizado ---*) ListPlot[Table[{n - 1, dataGPR[[n]]}, {n, 64}], PlotRange -> {-0.4, 0.8}];
Prosseguindo, vamos calcular a transformada de Fourier discreta do pulso GPR usando a função Fourier[expr].
3.1. SÉRIE E TRANFORMADA DE FOURIER
0.3
0.3
0.2
0.2
0.1
0.1
10
20
30
40
50
60
-0.1
10
20
281
30
40
50
60
-0.1
Figura 3.41: Componente real da TFD do pulso GPR (a) representação discreta, (b) representação interpolada. In[7]:= (*--- Exemplo 3.43:
TFD direta do pulso GPR ---*)
tfdPulsoGPR = Fourier[dataGPR, FourierParameters -> {1, -1}]; In[8]:= (*--- Exemplo 3.43:
Lista tfdPulsoGPR ---*)
Short[3/nP tfdPulsoGPR, 4] Out[8]//Short= {0.35063 + 0.i, 0.0911312 − 0.765956 i, −0.11433 − 0.0370001 i, >, −0.0455271 + 0.00815592 i, −0.11433 + 0.0370001 i,
0.0911312 + 0.765956 i}
√ Observe que o resultado da transformada foi dividido por N, no caso √ por 64 = 8, para compatibilizar a nossa definição de DFT com a do Mathematica. É uma boa idéia analisar este resultado através de gráficos. Pois bem, para facilitar a visualização decidimos mostrar na Figura 3.41 a componente real da TFD do pulso GPR por meio de dois gráficos: (a) de forma discreta e (b) na forma contínua interpolada. É claro que a seqüência discreta é a que efetivamente se usa na prática. A forma contínua interpolada serve apenas de guia para acompanhar a visualização do gráfico (a) da forma discreta. In[9]:= (*--- Figura 3.41:
Componente real da lista a
tfdPulsoGPR ---*)
Analogamente, a Figura 3.42 mostra a componente imaginária da TFD do pulso GPR na forma de dois gráficos: (a) pontos discretos e (b) pontos interpolados linearmente. In[10]:= (*--- Figura 3.42: tfdPulsoGPRd ---*)
Componente imaginária da lista
282
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR 0.75
0.75
0.5
0.5
0.25
0.25 10
20
30
40
50
60
-0.25
10
20
30
40
50
60
-0.25
-0.5
-0.5
-0.75
-0.75
Figura 3.42: Componente imaginária da TFD do pulso GPR (a) representação discreta, (b) representação interpolada. Comparando os gráficos (b) das Figuras 3.41 e 3.42 com os gráficos da Figura 3.31 é fácil ver que aqueles estão rebatidos em torno do ponto 32, que corresponde exatamente ao centro de simetria dos gráficos da Figura 3.31. O leitor deve rever a Tabela 3.1 e as Figuras 3.37 e 3.38 para se conscientizar da razão deste rebatimento nos dados. A esta altura, seria interessante recuperar os dados originais Out[5] a partir da lista Out[8] por meio da transformada inversa de Fourier discreta. É o que trata o próximo exemplo. Exemplo 3.44: Usar o resultado do exemplo anterior para computar a transformada inversa de Fourier discreta e assim recuperar o pulso GPR no domínio do tempo. Para tanto, basta simplesmente aplicar a função InverseFourier[expr] à lista tfdPulsoGPR computada em In[7]. Com efeito, In[11]:= (*--- Exemplo 3.44:
TFD inversa do pulso GPR ---*)
itfdPulsoGPR = InverseFourier[tfdPulsoGPR, FourierParameters -> {1, -1}]; In[12]:= (*--- Exemplo 3.44:
Lista da itfdPulsoGPR ---*)
Short[itfdPulsoGPR , 4] // Chop Out[12]//Short= {0, 0.0957466, 0.186156, 0.270575, 0.348437, 0.419269, 0.482688,
>, −0.166789, −0.142682, −0.11826, −0.0937806, −0.0694894,
−0.0456196, −0.0223892}
Observa-se que os resultados Out[5] e Out[12] são perfeitamente iguais. Na verdade, isto acontecerá sempre, independentemente do número de pon-
3.1. SÉRIE E TRANFORMADA DE FOURIER
283
tos de amostragem, pois as transformadas discretas de ida e vinda são cíclicas. Resumindo: Iniciemos com o pulso GPR, no domínio do tempo, na forma digitalizada com 64 valores eqüidistante, como mostra a Figura 3.40. Em seguida, se aplicou a transformada de Fourier discreta aos dados digitalizados tendo com resultado as componentes real e imaginária no domínio da freqüência, ilustradas nas Figuras 3.41 e 3.42. Estas aparecem devidamente rebatidas em torno do ponto 32 para formar o período fundamental de amostragem, como determina a teoria da transformada de Fourier discreta. Por fim, estes dados rebatidos foram submetidos à transformada inversa de Fourier discreta que trouxe de volta o pulso GPR digitalizado no domínio do tempo, e assim, fechando o ciclo completo. No exemplo anterior, um ponto crucial que deve ser observado é que os dados após serem transformados, para o domínio da freqüência, mostram-se rebatidos ao longo do período de amostragem. Assim, para aplicar a transformada inversa discreta a estes dados, não houve necessidade de qualquer re-arrumação deles. No próximo exemplo, vamos repetir esta segunda parte do problema, mas, desta feita, será usada a solução exata no domínio da freqüência. Aí sim, além de digitalizar, teremos de distribuir convenientemente os dados ao longo do período fundamental de amostragem. Exemplo 3.45: No Exemplo 2.91 mostrou-se que o pulso GPR, no domínio da freqüência, é expresso pela fórmula (resultado Out[57], página 237): ¡ ¢ 24 1 − e−3/2−3iw π pbGP R (w) = . (3.86) 16π 2 − 9 (i − 2w)2
Agora, vamos, a partir desta fórmula, reconstituir numericamente o pulso GPR no domínio do tempo, usando-se a transformada inversa de Fourier discreta. O primeiro passo é codificar a formula 3.86. Então, In[13]:= (*--- Exemplo 3.45: Codificação da fórmula 3.88 ---*) fourierPulsoGPR[w_]:= 24 (1 - Exp[-3/2 - 3 I w])* Pi/(16 Pi^2 - 9 (I - 2 w)^2)
Para ajudar resolver o problema é conveniente visualizar graficamente as componentes real e imaginária da fórmula 3.86. Isto já foi feito na Figura 3.31. Por questão de comodidade de cálculos vamos repeti-la aqui (Figura 3.43).
284
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR (a) 0.8
(b) 0.8 0.6
0.6
0.4 0.4
0.2
0.2
-15
-10
-5
5
10
15
-0.2 -15
-10
-5
5
10
15
-0.2
-0.4 -0.6
-0.4
-0.8
Figura 3.43: Cópia da Figura 2.102. Componentes real e imaginária da transformada de Fourier do pulso GPR. In[14]:= (*--- Figura 3.43:
Gráfico das componentes real e imaginária
da fórmula 3.85 ---*)
Como já foi explicado acima, antes de aplicar a transformada inversa discreta de Fourier é necessário organizar os dados convenientemente. Mas antes, vamos mostrar graficamente como é feito este procedimento de organização dos dados. Usando-se os diagramas das Figuras 3.38 e 3.39 como guia, o primeiro passo é definir o período fundamental da expansão periódica da função. Neste exemplo escolhemos um período de amostragem de 60 pontos. O rebatimento dos dados é feito em torno do ponto central, ou seja, em torno do trigésimo ponto. Em liguagem do Mathematica podemos escrever In[15]:= (*--- Exemplo 3.45:
Rebatimento da componentes real e
imaginária do pulso GPR no domínio da freqüência ---*) iFpulsoGPRr[w_]:= If[w < 30, 24 (1 - Exp[-3/2 - 3 i w]) Pi/(16 Pi^2 -9 (i - 2 w)^2), 24 (1 - Exp[-3/2 - 3 i (60 - w)]) Pi/(16 Pi^2 -9 (i - 2 (60 - w))^2)]
Agora, vamos visualizar os gráficos das componentes real e imaginária distribuídas ao longo do periodo fundamental da expansão periódica.(Figura 3.44). In[16]:= (*--- Exemplo 3.44:
Gráficos das componentes real e
imaginária rebatidas ---*)
3.1. SÉRIE E TRANFORMADA DE FOURIER 0.8
285
0.8 0.6
0.6
0.4 0.4
0.2
0.2 -0.2 10 -0.2 -0.4
20
30
40
50
60
10
20
30
40
50
60
-0.4 -0.6 -0.8
Figura 3.44: O período fundamental da expansão peródica das componentes real e imaginária do pulso GPR no domínio da freqüência. Na prática, este processo de expansão periódica é feito junto com a digitalização dos dados. Assim, usando-se 64 pontos de amostragem e rebatendo em torno do ponto 32, podemos escrever In[17]:= (*--- Exemplo 3.44: Digitalização das componentes real e imaginária -- -*) rEdFpulsoGPR = Join[Table[Re[dFpulsoGPR[w]], {w, 0., Pi nP/3, 2 Pi/3}], Reverse[Table[Re[dFpulsoGPR[w]], {w, 2. Pi/3, Pi (nP - 2)/3, 2 Pi/3}]]]; iMdFpulsoGPR = Join[Table[Im[dFpulsoGPR[w]], {w, 0., Pi nP/3, 2 Pi/3}], Reverse[Table[-Im[dFpulsoGPR[w]], {w, 2. Pi/3, Pi (nP - 2)/3, 2 Pi/3}]]]; In[19]:= (*--- Exemplo 3.45: Lista dFpulsoGPR ---*) Short[rEdFpulsoGPR + I iMdFpulsoGPR, 4] Out[19]//Short= {0.350928 + 0.i, 0.0914293 − 0.765956 i, −0.114031 − 0.0370003 i, >, −0.0452279 + 0.00815612 i, −0.114031 + 0.0370003 i, 0.0914293 + 0.765956 i}
A Figura 3.45 mostra os gráficos das duas componentes já digitalizadas. In[20]:= (*--- Exemplo 3.45: Gráficos das componentes real e imaginária digitalizadas ---*)
Agora é só chamar a função InverseFourier[expr] e calcular a transformada inversa. Então,
286
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR 0.8
0.8
0.6
0.6 0.4
0.4
0.2
0.2 -0.2 10
20
30
40
50
60
-0.2
10
20
30
40
50
60
-0.4 -0.6 -0.8
-0.4
Figura 3.45: Versão discreta das componentes real e imaginária do pulso GPR no domínio da freqüência. In[21]:= (*--- Exemplo 3.45 --- TDF do pulso GPR ---*) idTpulsoGPR = InverseFourier[rEdFpulsoGPR + iI imdFpulsoGPR, FourierParameters -> {1, -1}]; In[22]:= (*--- Exemplo 2.106:
Lista dTpulsoGPR ---*)
Short[nP Re[dTpulsoGPR]/3, 4] Out[22]//Short= {0.000773101 , 0.0949632, 0.186459, 0.270429, 0.348522, 0.419215, 0.482726, >, −0.142633, −0.118328, −0.0936792, −0.0696575, −0.0452871, −0.0233149}
Para efeito de comparação vamos traçar o gráfico do pulso GPR original junto com os dados que acabamos de computar. In[23]:= (*--- Figura 3.46 :
Comparação do gráfico do pulso GPR original
com o do pulso computado ---*)
Qualquer tipo de coleta de dados, seja de fenômenos naturais (observações meteorológicas, magnetotelúricas, cosmológicas, etc), seja de fontes artificiais (telefonia, dados sísmicos, TV, tomografia, etc) está sujeita à contaminação por ruídos aleatórios. É bem verdade que grande parte de contaminação nos dados deve-se à limitações nos instrumentos de medida e às técnicas usados nas observações dos dados, porém são as flutuações provocadas for fenômenos de segunda ordem, a verdadeira fonte de ruídos aleatórios. Uma das aplicações mais importantes da TFD é na filtragem de dados contaminados com ruído aleatório. Normalmente, as freqüências dos harmônicos correspondentes ao ruído são mais altas que as do sinal que se
3.1. SÉRIE E TRANFORMADA DE FOURIER
287
0.8
0.6
0.4
0.2
10
20
30
40
50
60
-0.2
-0.4
Figura 3.46: Comparação do pulso GPR original com o pulso computado com 64 pontos através da transformada inversa de Fourier discreta da fórmula 3.36. Os pontos correspondem ao pulso original e os cículos ao pulso calculado. deseja observar. Assim, a multiplicação do sinal por uma função de suporte compacto40 — tipo gaussiana, por exemplo — ambos no domínio da freqüência, elimina os harmônicos de alta freqüência, deixado apenas os de baixa freqüência que caracterizam o sinal. Tecnicamente, esta estratégia é chamada de filtragem de dados. Sabemos, pelo teorema da convolução, que o produto de duas funções no domínio da freqüência corresponde à convolução no domínio do tempo. Por outro lado, lembramos que a transformada de Fourier de uma função de suporte compacto é também de suporte compacto41 . Com isso podemos dizer que o processo de filtragem nada mais é que a convolução de um sinal ruidoso com uma função de suporte compacto, ambos no domínio do tempo. A função de suporte compacto, neste caso, é chamada de função filtro e a operação de convolução é identificada como processo de filtragem. O próximo exemplo ilustra um caso simples do uso de um filtro passa-baixa42 na eliminação de ruído aleatório de um sinal sintético. 40
Uma função é dita de suporte compacto quando ela se anula fora de um intervalo fechado e limitado. 41 O pulso gaussiano além de satisfazer a esta propriedade, ele é peculiar, pois a sua transformada de Fourier é também uma função gaussiana, como foi visto no Exemplo 2.89. 42 Um filtro passa-baixa é aquele que a maioria dos harmônicos de alta freqüência são retidos, e apenas os harmônicos na faixa de baixa freqüência conseguem passar incólume pelo filtro.
288
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR
Exemplo 3.46: Aplicar a teoria da TFD para filtrar o pulso GPR contaminado com ruído aliatório, usando-se como filtro passa-baixa uma função gaussiana.
O primeiro passo é simular um pulso GPR digitalizado e contaminado com ruído aleatório. A contaminação é feito aplicando-se a função Random[ ] do Mathematica. Iniciando com a definição do pulso GPR (veja Exemplos 2.91 e 2.106) podemos escrever
In[24]:= (*--- Exemplo 3.46:
Difinição do pulso GPR ---*)
pulsoGPR[t_]:= Exp[-t/2] Sin[2 Pi t/3] UnitStep[t]* (1 - UnitStep[t - 3])
In[26]:= (*--- Exemplo 3.46 :
Digitalização e contaminação do
pulso GPR com ruído aleatório --*) nP = 256; pulsoGPRruidoso = Table[pulsoGPR[t] + 0.2(Random[ ] - 1/2), {t, 0, 3 - 3/nP, 3./nP}];
Vejamos, então, o gráfico do pulso GPR ruidoso que acabamos de construir. Embora o gráfico na Figura 3.47 pareça contínuo, ele é discreto com 256 pontos de amostragem.
In[28]:= (*--- Gráfico 3.47:
Pulso GPR contaminado com ruído
aleatório --*) ListPlot[Table[{n - 1, pulsoGPRruidoso[[n]]}, {n, nP}], PlotRange -> {-0.501, 0.8}, PlotJoined -> True]
3.1. SÉRIE E TRANFORMADA DE FOURIER
289
0.8
0.6
0.4
0.2
50
100
150
200
250
-0.2
-0.4
Figura 3.47: O pulso GPR digitalizado (256 pontos) e contaminado com ruído aliatório.
Agora vamos definir e digitalizar a função √filtro. Para isso vamos usar o seguinte pulso gaussiano, normalizado por 7 2π, 2
f (t) = e−(t/7)
/2
.
A digitalização produz uma lista de 256 valores denominada de filtroPB cujo gráfico aparece na Figura 3.48.
In[29]:= (*--- Exemplo 3.46:
Digitalização da função
filtro passa-baixa (PB) ---*) filtroPB = Drop[Table[Exp[-(n/7)^2/2], {n, -nP/2, nP/2}],-1];
In[30]:= (*--- Gráfico 3.48:
Função filtro digitalizada ---*)
ListPlot[Table[{-nP/2 + n - 1, filtroPB[[n]]}, {n, nP}], PlotRange -> {0, 1},PlotStyle -> PointSize[0.01]];
290
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR 0.4
0.3
0.2
0.1
-100
-50
50
100
Figura 3.48: Filtro passa baixa. Antes de se aplicar o teorema da convolução é preciso fazer a expansão periódica do filtro digitalizado, ou seja, determinar o período fundamental de amostragem do filtro. Isto é realizado através do rebatimento dos dados, tal como foi feito nos exemplos anteriores. Assim, In[31]:= (*--- Exemplo 2.109: Rebatimento da função filtro ---*) filtroPBr = RotateLeft[filtroPB, nP/2]/Apply[Plus, filtroPB]; In[32]:= (*--- Gráfico 3.46: Função filtro rebatida ---*) ListPlot[filtroBPr, PlotRange -> {0, .07}]; 0.06 0.05 0.04 0.03 0.02 0.01
50
100
150
200
250
Figura 3.49: Filtro passa-baixa rebatido
Agora é só aplicar o teorema da convolução no domínio da freqüência e efetuar a transformada inversa de Fourier discreta para reconstituir o pulso
3.1. SÉRIE E TRANFORMADA DE FOURIER
291
GPR filtrado. Em outras palavras, calcula-se a DFT do pulso GPR ruidoso digitalizado e a do filtro rebatido, em seguida multiplicam-se os dois resultados para se obter o pulso GPR filtrado no domínio da freqüência. Por fim, aplica-se a DFT inversa para se obter o pulso GPR filtrado no domínio do tempo. Tudo isto é feito com os seguintes comandos: In[32]:= (*--- Exemplo 2.109:
Rebatimento da função filtro ---*)
{t, 0, 3 - 3/nP, 3./nP}]; conv = InverseFourier[Fourier[dataGPRruido, FourierParameters -> {1, -1}] Fourier[filtroR, FourierParameters -> {1, -1}], FourierParameters -> {1, -1}]];
À guisa de ilustração a Figura 3.50 mostra a comparação entre o pulso GPR teórico e o pulso GPR filtrado. Confrontando este gráfico com o da Figura 3.47 não há duvida que este processo de filtragem é bastante eficaz. In[33]:= (*--- Figura 3.50 :
Comparação do gráfico do pulso GPR original
com o do pulso computado ---*)
0.8 0.6 0.4 0.2
10
20
30
40
50
60
-0.2 -0.4
Figura 3.50: Comparação do pulso GPR original com o pulso filtrado Convolução e deconvolução de sinais discretos No exemplo anterior, o processo de filtragem foi realizado no domínio da freqüência, visto que, neste domínio, o produto das transformadas das duas seqüências (o filtro e os dados ruidosos) é uma operação muito simples. Para se conseguir a função filtrada ao domínio do tempo bastou-se efetuar a transformação inversa de Fourier do produto das duas funções transformadas.
292
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR
O teorema da convolução nos garante que o processo de filtragem também pode ser efetuado no domínio do tempo. Mas, para fazê-lo é preciso dispor de uma teoria de convolução de sinais discretos. A seguir faremos uma breve exposição sobre este tema. Dadas as seqüências de dados (f0 , f1 , f2 . . . fm ) e (g0 , g1 , g2 . . . gn ) define-se a convolução discreta destas duas seqüências como sendo a seqüência (h0 , h1 , h2 . . . hm+n ) produzida pelo seguinte algotitmo
hj =
m+n X
gj−i fi ,
j = 0, 1, 2 . . . m + n,
(3.87)
i=0
em que gj−i = 0 se j − i < 0 ou j − i > n. Os zeros na frente e atrás da seqüência gj−i quando j − i < 0 ou j − i > n são denominados zeros complementares (conhecidos como pad, em inglês). O leitor atento pode constatar facilmente que a Fórmula (3.87) nada mais é que uma versão discreta da definição da operação de convolução (3.39). Por outro lado, a fórmula (3.87) também corresponde ao algoritmo da multiplicação de dois polinômios que têm como coeficientes as seqüências fm e gn . A dualidade entre os algoritmos da convolução discreta e do produto de dois polinômios é extremamente útil na análise de dados, em geral, e na técnica de filtragem de dados, em particular. Os exemplos a seguir ilustram estas idéias.
Exemplo 3.47: É fácil verificar que o produto dos polinômios 1 + 8x − 2x2 + 5x3 + 4x4 e 6 − 7x + 3x2 é o polinômio 6 + 41x − 65x2 + 68x3 − 17x4 − 13x5 + 12x6 . Por outro lado, mostra-se, por meio de (3.87), que a convolução discreta das seqüências {1, 8, −2, 5, 4} e {6, −7, 3} é a seqüência {6, 41, −65, 68, −17, −13, 12}, cujos termos são absolutamemnte iguais aos coeficientes do produto dos dois polinômios.
Para acompanhar o mecanismo do algoritmo da convolução discreta vamos efetuar as operações em (3.87) etapa por etapa. Então, vamos lá,
3.1. SÉRIE E TRANFORMADA DE FOURIER
293
∙
3 −7 6 0 0 0 0 0 0 0 0 1 8 −2 5 4 0 0
¸
=⇒
h0 = 6
∙
0 3 −7 6 0 0 0 0 0 0 0 1 8 −2 5 4 0 0
¸
=⇒
h1 = 41
∙
0 0 3 −7 6 0 0 0 0 0 0 1 8 −2 5 4 0 0
¸
=⇒ h2 = −65
∙
0 0 0 3 −7 6 0 0 0 0 0 1 8 −2 5 4 0 0
¸
=⇒
h3 = 68
∙
0 0 0 0 3 −7 6 0 0 0 0 1 8 −2 5 4 0 0
¸
=⇒ h4 = −17
∙
0 0 0 0 0 3 −7 6 0 0 0 1 8 −2 5 4 0 0
¸
=⇒ h5 = −13
∙
0 0 0 0 0 0 3 −7 6 0 0 1 8 −2 5 4 0 0
¸
=⇒
h6 = 12
Os zeros na frente e atrás das seqüências {6, −7, 3} {1, 8, −2, 5, 4} são os zeros complementares referidos acima. Observe que a seqüência {6, −7, 3} foi invertida e deslocada continuamente de acordo com a idéia central da operação de convolução explorada na Figura 3.15. Este é um bom momento para voltar à Figura 3.15 e re-analisá-la cuidadosamente até ter se certeza que o conceito de convolução está bem entendido. Lembre-se que o processo de aprendizagem é iterativo. É preciso ler e reler várias vezes para se certificar que o assunto está bem entendido. Exemplo 3.48: É claro que a multiplicação de dois polinômios é comutativa. Da mesma maneira, a convolução de duas seqüências também é comutativa (Re-veja a Figura 3.17). Repetindo o exemplo anterior com as seqüências comutadas, podemos reescrever
294
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR
∙
4 5 −2 8 1 0 0 0 0 0 0 0 0 0 0 6 −7 3 0 0 0 0
¸
=⇒
h0 = 6
∙
0 4 5 −2 8 1 0 0 0 0 0 0 0 0 0 6 −7 3 0 0 0 0
¸
=⇒
h1 = 41
∙
0 0 4 5 −2 8 1 0 0 0 0 0 0 0 0 6 −7 3 0 0 0 0
¸
=⇒ h2 = −65
∙
0 0 0 4 5 −2 8 1 0 0 0 0 0 0 0 6 −7 3 0 0 0 0
¸
=⇒
h3 = 68
∙
0 0 0 0 4 5 −2 8 1 0 0 0 0 0 0 6 −7 3 0 0 0 0
¸
=⇒ h4 = −17
∙
0 0 0 0 0 4 5 −2 8 1 0 0 0 0 0 6 −7 3 0 0 0 0
¸
=⇒ h5 = −13
∙
0 0 0 0 0 0 4 5 −2 8 1 0 0 0 0 6 −7 3 0 0 0 0
¸
=⇒
h6 = 12
A exemplo da convolução de funções, a seqüência fixa é chamada de filtro e a seqüência móvel é denominada de sinal de entrada e a seqüência resultante da convolução é o sinal de saída. Para executar, com o Mathematica, a convolução discreta de duas seqüências f e g (listas f e g na linguagem do Mathematica), basta completar a seqüência fixa com zeros (tantos zeros, na frente e atrás da seqüência fixa, quantos forem os elementos da seqüência móvel, menos um, exatamente como foi feito nos Exemplos 3.47 e 3.48) e acionar a função ListConvolve[expr]. Vejamos alguns exemplos. Exemplo 3.49: Usando-se as mesmas sequências u = {1, 8, −2, 5, 4} e v = {6, −7, 3} do exemplo anterior, vamos computar a convolução de u e v.
3.1. SÉRIE E TRANFORMADA DE FOURIER
295
Vamos considerar a seqüência u móvel e v fixa. In[34]:= (*--- Exemplo 3.49:
Convolução de u e v ---*)
u = {1, 8, -2, 5, 4}; v = {6, -7, 3}; zeroPad = Table[0, {n, Length[u] - 1}]; ListConvolve[u, Join[zeroPad, v, zeroPad]] Out[34]= {6, 41 , −65, 68 , −17 , −13 , 12}
Exemplo 3.50: Comutando a ordem das duas seqüências e repetindo o exemplo, resulta In[35]:= (*--- Exemplo 3.50:
Convolução de v e u ---*)
v = {6, -7, 3}; u = {1, 8, -2, 5, 4}; zeroPad = Table[0, {n, Length[v] - 1}]; ListConvolve[v, Join[zeroPad, u, zeroPad]] Out[35]= {6, 41 , −65, 68 , −17 , −13 , 12}
Note que ao contrário do exemplo anterior, a seqüência u foi considerada fixa e v móvel. Exemplo 3.51: O Mathematica convolve listas com termos simbólicos também. Por exemplo, In[36]:= (*--- Exemplo 3.50:
Convolução de u e v ---*)
u = {a, b, c, d, e, f, g, h}; v = {x, x^2, x^3, x^4}; zeroPad = Table[0, {n, Length[v] - 1}]; ListConvolve[v, Join[zeroPad, u, zeroPad]] Out[36]= {ax, bx + ax2 , cx + bx2 + ax3 , dx + cx2 + bx3 + ax4 , ex + dx2 + cx3 + bx4 , f x + ex2 + dx3 + cx4 , gx + f x2 + ex3 + dx4 , hx + gx2 + f x3 + ex4 , hx2 + gx3 + f x4 , hx3 + gx4 , hx4 }
Em muitas situações é comum se ter as seqüências de entrada e de saída de um sistema linear (invariante no tempo) sem, contudo, conhecer o filtro. A operação de deconvolução determina o filtro quando se conhece a entrada
296
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR
e a saída do sistema43 . Ao contrário da convolução, o Mathematica não contempla a opereração de deconvolução. Isso não chega a ser um problema, visto que a analogia entre a operação de convolução e o de multiplicação de polinômios nos permite usar o comando PolynomialQuotiente[expr] para efetuar a operação de deconvolução. Vejamos, então, como isto funciona. Exemplo 3.52: Dadas as seqüências de saida (6, 41, −65, 68, −17, −13, 12) e de entrada (1, 8, −2, 5, 4) de Exemplo 3.47, calcular o filtro. In[37]:= (*--- Exemplo 3.50: Divisão dos polinômios p1 por p2 ---*) p1 = 6 + 41 x - 65 x^2 + 68 x^3 - 17 x^4 -13 x^5 + 12 x^6; p2 = 1 + 8 x - 2 x^2 + 5 x^3 + 4 x^4; PolynomialQuotient[p1, p2, x] Out[37]= 6 − 7 x + 3 x2
A seqüência dos coeficientes deste polinômio coincide com o filtro do Exemplo 3.47. Exemplo 3.53: Calcular a deconvolução das seqüências ¢ e ¡ de entrada saida do Exemplo 3.51 e comparar o resultado com o filtro x, x2 , x3 , x4 do mesmo exemplo. In[37]:= (*--- Exemplo 3.50:
Divisão dos polinômios p1 por p2 ---*)
p1 = (a x) + (b x + a x^2) y + (c x + b x^2 + a x^3) y^2 + (d x + c x^2 + b x^3 + a x^4) y^3 + (e x + d x^2 + c x^3 + b x^4) y^4 + (f x + e x^2 + d x^3 + c x^4) y^5 + (g x + f x^2 + e x^3 + d x^4) y^6 + (h x + g x^2 + f x^3 + e x^4) y^7 + (h x^2 + g x^3 + f x^4) y^8 + p2 = a + b y + c y^2 + d y^3 + e y^4 + f y^5 + g y^6 + h y^7; PolynomialQuotient[p1, p2, y] Out[37]= x + x2 y + x3 y 2 + x4 y 3
Como previsto, a seqüência dos coeficientes do polinômio x+x2 y+x3 y 2 + em y coincide com o filtro do Exemplo 3.51.
x4 y 3 43
A operação de deconvolução é imensamente importante em geofísica. Os dados de entrada são fornecidos por fontes naturais (terremoto, corrente telúricas, campo geomagnético etc) ou fontes artificiais (fontes sísmicas, dipolos elétricos e magnéticos etc) e os dados de saída são as observações feitas por sensores na superfície, dentro da terra, no ar ou no mar. A deconvolução dos dados de entrada e saída fornece o filtro, ou seja, fornece as estruturas geológicas portadoras de petróleo, minério ou água subterrânea que "filtram" os dados de entrada gerando os dados de saída. (Veja a nota de rodapé 20, páginas 215-216)
3.2. SUMÁRIO
297 0.4
0.3
0.2
0.1
5
10
15
20
Figura 3.51: Filtro digital passa baixa. Exemplo 3.54: A filtragem do pulso GPR, do Exemplo 3.46, contaminado com ruído aleatório foi realizada no domínio da freqüência. Agora, neste último exemplo, vamos filtrá-lo do domínio do tempo. In[38]:= (*--- Grafico 3.51: Filtro digital passa-banda ---*) filtro = Table[Exp[-nF^2/100]/Sqrt[2. Pi], {nF, -10, 10}]; ListPlot[filtro, PlotRange -> {0, 0.401}];
In[38]:= (*--- Figura 3.52: Dados filtrados ---*) zeroPad = Table[0, {n, Length[filtro]/2}]; LdataFun = Join[zeroPad, Table[Exp[-t/2] Sin[2 Pi t/3] UnitStep[t]* (1 - UnitStep[t - 3]) + 0.1(Random[] - 1/2), {t ,0, 3, 0.01}], zeroPad]; conv = ListConvolve[filtro/Apply[Plus, filtro], dataFun]; ListPlot[Part[conv, Table[4n, {n, Length[conv]/4}]], PlotRange -> {-0.4, 0.8}]
do da convolução numérica do pulso GPR ruidoso da Figura 2.102 com o filtro digital passa baixa da Figura 2.103.
3.2
Sumário
Transformar para simplificar. No decorrer deste livro veremos vários tipos de transformadas, todas com o mesmo objetivo, o de simplificar a solução das equações de Maxwell. As transformadas funcionam em pares. A transformada direta converte um problema de solução difícil em uma família de
298
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR 0.8
0.6
0.4
0.2
10
20
30
40
50
60
-0.2
-0.4
Figura 3.52: Resultado da convolução numérica do pulso GPR ruidoso da Figura 2.102 com o filtro digital passa baixa da Figura 2.103. problemas de soluções elementares e fácies de serem obtidas. Por outro lado, a transformada inversa sintetiza estas soluções elementares para reconstituir a solução do problema original. A transformada de Fourier tem exatamente esta finalidade. Por exemplo, normalmente não é fácil resolver as equações de Maxwell no domínio do tempo. Com uma simples transformação de Fourier para o domínio da freqüência consegue-se simplificar substancialmente o problema. Uma das dificuldades de resolver as equações de Maxwell é conciliar a simetria das correntes do transmissor (antena) com a das correntes induzidas nos diversos corpos que formam o meio. A transformada de Fourier é uma das ferramentas que facilitam lidar com esta questão de simetria das diferentes fontes. Vimos que qualquer função pode ser reescrita como uma combinação de uma função par e outra ímpar. Uma função periódica par pode ser aproximada por co-senos e uma função periódica impar por senos. De modo geral, uma função periódica qualquer pode ser representada por uma série de senos e co-senos. Esta é a essência da série de Fourier. Funções periódicas, embora importantes, são muito particulares. Em geral as funções são não periódicas, seja porque elas se restringem a um intervalo finito da reta ou porque são definidas em toda reta. No primeiro caso, constrói-se temporariamente uma expansão periódica e aplica-se a série de Fourier. Apenas a aproximação dentro do intervalo de definição da função é interesse prático. No caso da função não periódica ser definida em toda reta usa-se a transformada de
3.3. EXERCÍCIOS
299
Fourier no lugar da série de Fourier. Em outras palavras, a série de Fourier é um caso particular de transformada de Fourier.
3.3
Exercícios
1. Prove a segunda parte do Teorema da Convolução. Sugestão: faça ω − κ = x em ¸ Z ∞ ∙Z ∞ h i 1 −1 b b f (ω) ∗ gb (ω) = f (κ) gb (ω − κ) dκ eiωt dω. F 2π −∞ −∞
2. Por que foi incluído o If no comodo In[4]na página ? Sugestão: reescreva e execute o comando sem o If e verifique o que acontece. 3. Mostre que ?? é consistente com a definição usual de derivada de uma função ordinária f (t) com primeira derivada contínua. Sugestão: Faça uma integração por parte e lembre-se que a função teste se anula em t = ±∞. 4. Prove que a função delta de Dirac é uma função par, isto é, δ (−t) = δ (t). Sugestão:Mostre que µ ¶ Z ∞ Z ∞ t 1 1 dt = φ (0) δ (at) φ (t) dt = δ (t) φ |a| −∞ a |a| −∞ e em seguida faça a = 1.
5. Prove a relação
Z
∞
δ (t) φ (t + t0 ) dt = φ (t0 )
−∞
6. Mostre que a versão discreta de (??) é a identidade (??). Sugestão: faça ω = n∆ω = 2πn/T e proceda como na página xxx. 7. Foi dito no exemplo 2.47 que sendo o pulso exponencial unilateral uma função nem par nem ímpar, a sua transformada de Fourier é complexa. Porém, a parte real é uma função par e a parte imaginária é uma função impar. Mostre que isso se verifica porque o pulso exponencial unilateral é uma função com valores reais. Usando o Mathematica, mostre através de um exemplo que uma função tomando volores complexos não satisfaz, necessariamente, esta propriedade.
300
CAPÍTULO 3. TRANSFORMAR PARA SIMPLIFICAR
8. Repita o exemplo 3.43 substituindo os 64 pontos de amostragem por 128 pontos. 9. Discretize as funções f (t) (3.37) e g (t) (3.38) e calcule a convolução numérica h (t) = f (t) ∗ g (t). Compare o resultado com o do Exemplo 3.12. 10. Mostre que a integral (3.40) h (x) =
Z
∞
e−y cos (xy) dy
0
é equivalente à integral 1 h (x) = x
Z
0
∞
e−y/x cos (y) dy
Capítulo 4
Leis de Coulomb, Ampère, Gauss e Faraday 4.1
Introdução
No primeiro capítulo, as equações de Maxwell foram introduzidas em cinco formulações distintas de modo axiomático sem muitas explicações acerca do significado físico de cada formulação. Dedicamos o segundo capítulo e parte do terceiro ao desenvolvimento das ferramentas matemáticas apropriadas para o entendimento das equações de Maxwell, e naturalmente, do eletromagnetismo como um todo. Agora neste quarto capítulo, estamos preparados para fazer o estudo minucioso das diferentes representações das equações de Maxwell, com ênfase nos aspectos físicos que distinguem uma representação da outra. É fundamental acompanhar todos os detalhes do desdobramento de cada uma das representações das equações de Maxwell para se ter completo controle da teoria eletromagnética e saber aplicá-la com desenvoltura. No decorrer deste capítulo veremos que as equações de Maxwell representam uma síntese de um vasto acervo de conhecimentos práticos de eletricidade, magnetismo e ótica, acumulados durante vários séculos. Do ponto de vista pedagógico, principalmente para os iniciantes no assunto, é interessante se ter algum conhecimento dos fatos históricos que precederam o desenvolvimento das quatro famosas equações do eletromagnetismo, comumente chamadas de equações de Maxwell. A bem da verdade, as quatro equações não foram formuladas propriamente por Maxwell, pelo menos na forma que as conhecemos. Dito isto, vamos iniciar com uma síntese da história do eletromagnetismo, destacando-se as contribuições de Coulomb, 301
302CAPÍTULO 4. LEIS DE COULOMB, AMPÈRE, GAUSS E FARADAY Ampère, Gauss e Faraday e obviamente a de Maxwell e de seus imediatos seguidores, os chamados Maxwellianos.
4.2
Sinopse Histórica do Eletromagnetismo
A história do eletromagnetismo é fascinante [20], [32], [53],[60], [84]. Ela se desdobra em três períodos: antes, durante e depois de Maxwell. O primeiro período inicia-se com o filósofo grego Thales, que viveu no século VI a.C. na cidade de Mileto, na costa da Jônia (hoje sudeste da Turquia). Thales foi um dos primeiros a estudar empiricamente os fenômenos elétricos e magnéticos. O termo eletricidade vem dessa época, proveniente do fato do âmbar1 , denominado electron em grego, ter a propriedade de atrair pequenas partículas de lã quando atritado. Do mesmo modo, o termo magnetismo está associado a um minério de óxido de ferro2 , abundante no distrito de Magnésia na região de Thessaly na antiga Grécia, que tem a propriedade de atrair objetos de ferro. Passaram-se dois mil anos até William Gilbert (1544-1603), médico da Rainha Elizabeth I da Inglaterra, estudar detalhadamente as propriedades elétricas e magnéticas de vários materiais. Foi ele um dos primeiros a verificar que alguns materiais, quando atritados, se atraem e outros não. Os primeiros, ele denominou de elétricos e os demais de não-elétricos. Gilbert pesquisou detalhadamente o campo magnético terrestre e descobriu que ele se comporta como um campo de um grande ímã. Foi Gilbert quem denominou de pólo norte e pólo sul às extremidades de uma agulha imantada (ou ímã), em analogia com o campo magnético terrestre. Os resultados de suas pesquisas foram publicados no famoso livro De Magnete, um marco que serviu de padrão científico por muitos séculos [?]. Dando continuidade aos estudos de Gilbert, o francês Charles-François du Fay (1698-1739) descobriu que materiais eletrificados por atrito não apenas se atraem mas também se repelem uns aos outros. Ele concluiu que existem dois tipos de eletricidade. Corpos com o mesmo tipo de eletricidade se repelem e com eletricidade diferente se atraem. Os que se comportam como o vidro após ser atritado por seda, ele denominou-os de vítreos e os que se comportam como o âmbar atritado com lã, ele os chamou de resinosos. Posteriormente, o famoso cientista e político americano Benjamin Franklin 1
Resina fóssil, sólida, amarelo-pálida, proveniente de uma espécie extinta de pinheiros do período terciário. 2 Minério rico em magnetita, carbonato de magnésio (MgCO3 ). Entre os todos os minerais conhecidos, a magnetita é o que apresenta maior intensidade de magnetismo.
4.2. SINOPSE HISTÓRICA DO ELETROMAGNETISMO
303
(1706-1790) substituiu essa terminologia para positivos e negativos, respectivamente. Charles Coulomb (1736-1806), um físico francês, descobriu, usando uma balança de torção muito sensível, que a lei do inverso do quadrado da distância, semelhante à da atração gravitacional de Sir Isaac Newton (1642-1727), também se aplica à força de atração ou repulsão entre duas cargas elétricas ou dois pólos magnéticos. Henry Cavendish (1731-1810) um hábil físico experimental inglês realizou várias descobertas de eletricidade e magnetismo mas não se deu ao trabalho de publicá-las. Suas notas foram publicadas 69 anos depois de sua morte, por Maxwell. Muitas descobertas feitas por Coulomb, Ohm, Volta, Henry, Faraday e muitos outros foram antecipadas por Cavendish. Por exemplo, ele descobriu e mediu a permissividade elétrica de um meio e também introduziu o conceito de potencial elétrico Até 1780 os experimentos com eletricidade se resumiam à eletrostática. A única maneira prática de se gerar eletricidade era por meio de aparatos eletrostáticos usando algum processo de atrito, sem, contudo, ser possível armazenar a eletricidade produzida. Entre os vários engenhos para armazenar eletricidade estática destaca-se a Jarra de Leyden desenvolvida por Pieter van Musschenbroek (1692-1761) professor em Leyden, Holanda. A Jarra de Leyden é constituída por uma recipiente de vidro forrado interna e externamente por uma camada metálica e agindo tal qual um capacitor com o poder de produzir violentas descargas elétricas. Luigi Galvani (1737-1798), um fisiologista italiano, descobriu, em 1780, um novo fenômeno elétrico. Ele observou que dois condutores de metais de constituições químicas diferentes, zinco e cobre, por exemplo, um conectado ao músculo e o outro prezo ao nervo da perna de uma rã dissecada, produzia, momentaneamente, uma contração violenta na perna do animal, quando os dois condutores eram tocados um ao outro. Galvani erroneamente acreditava que a fonte de eletricidade era o tecido animal da perna da rã, e que o fenômeno observado era semelhante à descarga de uma Jarra de Leyden. Galvani, em 1971, publicou sua Teoria da Eletricidade Animal com a descrição de todas suas observações. Este trabalho gerou muita polêmica e suscitou o interesse de vários pesquisadores em investigar as idéias do autor. Alessandro Volta (1745-1827) professor de filosofia natural na Universidade de Pavia, na Itália, repetiu vários experimentos de Galvani e logo se convenceu que a fonte de eletricidade era devido ao contato dos dois metais e que os músculos e tecidos da perna da rã serviam apenas como um detector. Em vez do tecido animal usado como elo entre o par metálico, Volta lançou mão de soluções de sais e ácidos obtendo efeitos elétricos muito mais intensos. Um de seus experimentos consistia de vários potes empilhados e
304CAPÍTULO 4. LEIS DE COULOMB, AMPÈRE, GAUSS E FARADAY interligados por um condutor curto, contendo soluções de sal e ácido com lâminas alternadas de zinco e cobre. A partir desses experimentos, Volta desenvolveu o que hoje é chamada de pilha voltaica dando início a uma nova fonte de eletricidade. Com o aperfeiçoamento das pilhas voltaicas, logo apareceram baterias capazes de produzir correntes contínuas de razoável intensidade, abrindo caminho para muitas outras descobertas.3 . Hans Christian Oersted (1777-1851), professor de física em Copenhagen, anunciou em 1807 que o propósito de suas investigações era determinar a relação entre eletricidade e magnetismo. Depois de treze anos de fracassos, ele finalmente conseguiu, por acaso, o resultado almejado. Uma corrente elétrica num condutor, gerada por uma pilha voltaica, exerce uma força num ímã nas imediações do condutor. Oersted verificou que a direção da força sobre o pólo do ímã, próxima a um fio de arame, se dava ao longo de uma circunferência entorno do fio. Com isso, Oersted mostrou que uma corrente elétrica produz efeito magnético, uma descoberta de fundamental importância para o avanço da ciência. Por isso, alguns historiadores afirmam que o ano de 1820 marca o início do eletromagnetismo como ciência. O matemático e físico francês André Marie Ampère (1777-1836) ficou muito impressionado com as descobertas de Oersted. Uma semana após ter tido conhecimento dos resultados de Oersted, Ampère apresentou à Academia Francesa de Ciências um trabalho no qual demonstrava que dois fios paralelos se atraem quando correntes elétricas fluem no mesmo sentido e se repelem quando fluem em sentido contrário. Ampère quantificou este fenômeno, concebendo que cada incremento elementar de um circuito, onde flui uma corrente elétrica, exerce uma força sobre qualquer incremento elementar de um segundo circuito, munido também de corrente elétrica. O conceito teórico de elemento de corrente num circuito, que corresponde ao produto da corrente i pelo incremento dl, é, portanto, devido à Ampère. Ele desenvolveu a formulação matemática que caracteriza a força entre dois elementos de corrente, hoje conhecida como Lei de Ampère. Os resultados das investigações do matemático alemão Georg Simon Ohm (1789-1854) contribuíram para a simplificação da teoria de circuito elétrico. Ohm descobriu que a corrente em um circuito é proporcional a uma espécie de força injetora, denominada por ele, de força eletroscópica4 . Nas experiências de Ohm, a força eletroscópica era fornecida por meio de pilhas voltaicas, por isso, atualmente esta "força "é denominada de voltagem. 3
O curioso é que o princípio físico de pilhas e baterias não mudou muito desde o tempo de Volta, a despeito dos milhões de dólares investidos em pesquisa. 4 Ohm usou um eletroscópio para medir a voltagem, daí o termo força eletroscópica.
4.2. SINOPSE HISTÓRICA DO ELETROMAGNETISMO
305
A constante de proporcionalidade a que Ohm se referia é, hoje, conhecida como a resistência do circuito, e a relação de proporcionalidade V = iR é conhecida com Lei de Ohm. O fato de uma corrente elétrica causar efeito magnético foi descoberto, como vimos, por Oersted em 1820. Em 1831, Michael Faraday (1791-1867), um físico e químico inglês, descobriu que a variação de um campo magnético5 produzia corrente elétrica num circuito. Ele observou que um campo magnético estático não gerava corrente elétrica, mas um campo magnético dinâmico sim, produzia corrente elétrica6 . A descoberta de Faraday abriu caminho para se produzir eficientemente energia elétrica em grande quantidade. De fato, com a assistência de Faraday foi construída, na Inglaterra, a primeira hidroelétrica. Faraday fez, também, substanciais contribuições à eletrostática. Ele descobriu em 1837 que a força, entre duas partículas carregadas, decresce quando o espaço é preenchido por um meio isolante substituindo o ar. Faraday descobriu que diferentes materiais isolantes, também chamados dielétricos, possuem diferentes permissividades, propriedade que caracteriza um material não-condutor de eletricidade. Por isso, a unidade de permissividade é farad/m, em sua homenagem. O conceito de linhas de força de Faraday foi de considerável importância no desenvolvimento do eletromagnetismo, para não dizer de toda física moderna. O que hoje é concebido como campo elétrico e campo magnético eram vistos por Faraday como linhas de força elétricas e magnéticas se estendendo no espaço como se fossem fios de um tecido invisível, em forma de malha. Segundo Faraday, a influência eletromagnética entre diferentes corpos eletrificados se dava através de deformações das linhas de forças que permeavam o espaço na vizinhança dos corpos. Esta é uma idéia brilhante, ainda hoje ela está por trás das teorias geométricas modernas de campo. Joseph Henry (1797-1878) um físico americano realizou inúmeros experimentos eletromagnéticos. Em 1831 ele desenvolveu o primeiro motor elétrico e o primeiro telégrafo. Em 1832, Henry anunciou uma de suas grandes descobertas, o fenômeno da auto-indução. Por isso a unidade de auto-indução no Sistema Internacional de unidades é denominada de henry e a de permeabilidade magnética de henry/m, em sua homenagem. Karl Friedrich Gauss (1777-1855), matemático alemão, reconhecido como o maior matemático de todos os tempos, contribuiu decisivamente para o 5
Para Faraday, campo magnético era uma região caracterizada por suas linhas de força sobre a influência de um ímã. 6 A descoberta de Oersted junto com a de Faraday são duas das maiores descobertas científicas de todos os tempos. Hoje, com certeza, ambos mereceriam prêmio Nobel por suas contribuições à humanidade [28].
306CAPÍTULO 4. LEIS DE COULOMB, AMPÈRE, GAUSS E FARADAY desenvolvimento da teoria eletromagnética. Seus estudos sobre magnetismo e em particular sobre magnetismo terrestre são um marco nessa área do conhecimento científico. Gauss constatou que não existem na natureza, a exemplo de cargas elétricas, cargas magnéticas isoladas7 . O físico alemão Wilhelm Weber (1804-1891) dando continuidade aos trabalhos de Gauss, propôs uma teoria eletromagnética, baseada no princípio da ação à distância, reconhecida atualmente como Eletrodinâmica de Weber, totalmente consistente com as observações práticas de eletricidade e magnetismo, até então conhecidas [?], [2]. Com as descobertas de Coulomb, Ampère, Gauss e Faraday, entre outros8 , o terreno para a consolidação de uma nova teoria eletromagnética estava praticamente preparado para as memoráveis contribuições de Maxwell. Em 1873, James Clerk Maxwell (1831-1879), matemático, físico teórico e experimental escocês, publicou a sua extraordinária obra, A Treatise on Electricity and Magnetism, [48], como uma alternativa à Eletrodinâmica de Gauss e Weber, como Maxwell mesmo se referiu. Talvez por respeito ao nome de Gauss, a maior autoridade no assunto, na época, Maxwell foi extremamente modesto na apresentação de sua obra. Hoje, alguns historiadores defendem a tese de que essa atitude defensiva de Maxwell pode ter retardado, em alguns anos, o avanço da física e em particular o da matemática [?]. De qualquer modo, a história fez justiça e hoje a teoria eletromagnética de Maxwell é unanimemente reconhecida como uma das maiores criações da mente humana. A Enciclopédia Britânica no Vol 15, p. 4, 1967. refere-se ao Treatise on Electricity and Magnetism dizendo que ”Esse trabalho é um dos mais esplêndidos monumentos que o gênio de um único indivíduo pode realizar”. Logo após sua graduação em Cambridge, Maxwell publicou um trabalho intitulado ”Sobre as linhas de força de Faraday” e encaminhou uma cópia a Faraday, que tinha na época sessenta e cinco anos. O trabalho era uma tentativa de explicar as idéias do mestre em forma matemática. Faraday ficou bastante impressionado com o trabalho de Maxwell. 7 Até hoje, esta é uma das leis fundamentais da natureza. Paul Dirac (1902-1984) um dos fundadores da teoria quântica relativista advogava que do ponto de vista teórico deveriam existir cargas magnéticas isoladas. Grande esforço científico e muito dinheiro vem sendo investido para averiguar experimentalmente esta conjectura, mas até agora sem sucesso. Caso isto venha, um dia, ser confirmado, com certeza, teremos uma das maiores revoluções científicas da história. A teoria eletromagnética terá de ser revista e junto com ela a teoria da relatividade! 8 Thales, Gilbert, du Fay, Franklin, Galvani, Volta, Oersted, Ohm, Henry, Cavendish, Weber (1804-1891), Jean Baptist Biot (1774—1862) e Félix Savart (1791-1841) colaboradores de Ampère, para citar apenas alguns nomes.
4.2. SINOPSE HISTÓRICA DO ELETROMAGNETISMO
307
O conceito de linhas de força elétrica e magnética tinha um extraordinário apelo para Maxwell. Os físicos naquela época, influenciados por Gauss e Weber, concebiam a força entre cargas ou correntes elétricas como a ação à distância, sem nenhuma participação do meio circundante. Ademais, se pensava que os efeitos elétricos e magnéticos se davam instantaneamente. Maxwell rejeitava essas idéias, como também o fez Faraday. Maxwell acreditava que o meio circundante entrava em estado de tensão quando as linhas de força se deformavam devido à ação de cargas elétricas. Maxwell traduziu brilhantemente, em termos matemáticos simples, essa e outras idéias de seus antecessores num conjunto de vinte equações. A grande revelação do trabalho de síntese de Maxwell é a presença de um termo em suas equações que não correspondia a nenhum fenômeno eletromagnético até então observado. Maxwell introduziu o conceito de corrente de deslocamento para explicar a origem desse novo termo. Com esse toque de gênio, Maxwell chegou à conclusão que a luz nada mais é do que campo elétrico e magnético se propagando no espaço. Com isto, ele incluiu a ótica junto com a eletricidade e o magnetismo em sua teoria, abrindo caminho para o estudo das ondas eletromagnéticas. Infelizmente, Maxwell morreu em 1879, aos 48 anos, cedo de mais para ver os frutos de suas brilhantes idéias vingar. Pode-se dizer que Maxwell construiu todas as peças de um quebra-cabeça, mas não teve tempo suficiente de montá-las e apreciar o belo desfecho, deixando esta tarefa para seus seguidores. Com o risco de abusar das metáforas, desculpem-me por mais uma. Maxwell conhecia o mapa da mina (eletromagnetismo), mas infelizmente não teve tempo de descobri-la. Com o roteiro deixado por ele, a mina foi finalmente descoberta por seus sucessores.E que mina! A terceira fase da história do eletromagnetismo começa em 1879, no mesmo ano da morte de Maxwell, com os Maxwellianos: George Francis FitzGerald (1851 - 1901), Oliver Lodge (1851-1940), Oliver Heaviside (1850-1925) e Heinrich Hertz (1857-1894) [32]. Durante aproximadamente quinze anos de trabalho intensivo essas quatro personagens desvendaram todos os mistérios da teoria eletromagnética segundo os ditames de Maxwell. Foram os Maxwellianos, e não Maxwell, que desenvolveram a teoria das ondas eletromagnéticas em toda sua plenitude. As contribuições dos quatros Maxwellianos foram decisivas para o desenvolvimento do eletromagnetismo como conhecemos hoje. Por falta de espaço, vamos relatar somente as contribuições de Heaviside e de Hertz, embora as contribuições de FitzGerald e Lodge são tão importantes quanto às dos outros dois. A propósito, FitzGerald era o líder do grupo e após o seu falecimento em 1901, o grupo dos Maxwellianos se desfez.. Não obstante o elogio da Enciclopédia Britânica, a teoria proposta por
308CAPÍTULO 4. LEIS DE COULOMB, AMPÈRE, GAUSS E FARADAY Maxwell em seu Tratado de Eletricidade e Magnetismo era complexa, desarrumada, feia e de difícil assimilação. Por isso mesmo, não foi totalmente aceita logo de pronto. Heaviside foi um dos que tiveram muita dificuldade de acompanhar as idéias de Maxwell. Depois de vários anos de trabalho intensivo, Heaviside conseguiu reformular o emaranhado das vinte fórmulas originais propostas por Maxwell, em apenas quatro equações vetoriais9 . Para tanto, Heaviside teve que criar parte do cálculo vetorial, ainda desconhecido na época de Maxwell. Na verdade, foi o legado deixado por Maxwell, a força propulsora para o desenvolvimento do cálculo vetorial que hoje conhecemos10 . As quatro famosas equações vetoriais, conhecidas como equações de Maxwell, presentes em todos os livros de eletromagnetismo, deve-se a Heaviside, embora elas contenham absolutamente as mesmas informações das vinte equações originais de Maxwell. Heaviside não extraiu nem incluiu absolutamente nada, apenas arrumou a casa, à luz de uma nova ferramenta matemática11 . Depois da reorganização por Heaviside, a teoria eletromagnética de Maxwell deslanchou, deixando para trás as outras teorias, inclusive a de Gauss e Weber. A segunda personagem, pós Maxwell, fundamental no desenvolvimento da teoria eletromagnética é o alemão12 Heinrich Hertz (1857-1894). Quinze anos depois de ser publicado o tratado de Maxwell, Hertz mostrou experimentalmente que ondas eletromagnéticas não eram apenas conjecturas matemáticas, mas, de fato, tinham consistência física. A reformulação feita por Heaviside teve grande impacto nos trabalhos de Hertz13 . Por meio de correspondências, as idéias de um beneficiavam o trabalho do outro14 . 9
Ou oito equações escalares, se assim desejarem. O cálculo vetorial foi desenvolvido por Josiah Willard Gibbs (1839-1903) e Heaviside a partir dos quatérnios de William Rowan Hamilton (1805-1865). Mas, foi o eletromagnetismo de Maxwell a musa inspiradora, pelo menos para Heaviside. 11 Este é um exemplo clássico em que uma boa representação matemática simplifica e esclarece os segredos da natureza. A propósito, o cálculo vetorial não é ainda a ferramenta matemática ideal para desvendar toda a beleza do eletromagnetismo. As formas diferenciais e a álgebra geométrica de Clifford são, atualmente, as ferramentas apropriadas para aqueles que desejam descortinar toda a elegância da teoria eletromagnética. 12 Os outros três Maxwellianos eram ingleses. 13 As experiências de FitzGerald e Lodge e a troca de correspondências ente os quatro Maxwellianos, ajudaram sobremaneira nas descobertas de Hertz. Lodge era um exímio físico experimental, chegou a elaborar aparatos para estudar ondas eletromagnéticas por meios de modelos mecânicos com polias, rodanas, correias e alavancas! Vê-se, que os quatros Maxwellianos formavam um grupo sui generis. Num extremo, Heaviside, um teórico de altíssimo calibre e no outro extremo, Lodge, um físico experimental incomparável. Hertz jogando nas duas pontas e Fitzgerald, o maestro do grupo. Daí, só poderia sair uma obra fabulosa. 14 Heaviside era arredio e de personalidade quase patológica. É uma pena que Hertz 10
4.2. SINOPSE HISTÓRICA DO ELETROMAGNETISMO
309
Durante suas experiências, Hertz demonstrou que ondas eletromagnéticas podiam sofrer reflexão, refração e polarização tal como a luz. Justamente como previu teoricamente Maxwell, as velocidades das ondas eletromagnéticas e da luz tinham exatamente o mesmo valor15 . Em 1889, com trinta e dois anos de idade, Hertz proferiu sua célebre palestra sobre a relação da luz com as ondas eletromagnéticas, e por muito tempo estas passaram a ser chamadas de ondas hertzianas16 . Quatro anos mais tarde, aos trinta e seis anos, Hertz morreria sem ver, como Maxwell, os frutos de suas descobertas. Coube ao inventor italiano Guglielmo Marconi (1874-1937) transmitir, em dezembro de 1901, o primeiro sinal radiotelegráfico através do Atlântico, dando início à era das comunicações. Desde então os avanços na tecnologia das comunicações não param, culminando com a Internet, verdadeira revolução nos tempos modernos.17 A unidade de freqüência no SI é hertz em homenagem a Hertz. Com a morte de FitzGerald em 1901 estava concluída a obra de Maxwell que tantos benefícios têm proporcionado à humanidade. Embora não sendo um dos Maxwellianos, o croata Nikola Tesla (18561943) contribuiu com grandes invenções tecnológicas eletromagnéticas. Por volta de 1887-1889 ele foi o criador da técnica das correntes pilifásicas e principalmente dos motores de campo giratório, bem como dos geradores modernos de correntes alternadas [76]. A unidade de densidade de fluxo magnético, no SI, é denominada de Tesla em sua homenagem.18 . nunca teve oportunidade de se encontrar com Heaviside [53]. 15 O astrônomo dinamarquês Ole Roemer (1644-1710) determinou, pela primeira vez, o valor 224000 km/s para a velocidade da luz. Em 1889, na época de Hertz, o valor conhecido da velocidade da luz, no vácuo, era 299853 km/s. Hoje o valor padrão é 299792458 m/s e é uma das costantes fundamentais na natureza. 16 Hoje, esta denominação está em desuso. 17 Há quem diga que a Internet terá maior impacto (para o bem ou para o mal) à humanidade que a invenção da impressa por Johann Gutenberg (1398-1468) na idade média, entre 1394 e 1399. 18 Homenagem justa, diga-se de passagem. É deveras surpreendente que Tesla desconhecia totalmente a obra de Maxwell. Tesla era um homem prático, com exíguos conhecimentos teóricos. Mesmo assim, foi um gênio. Tal qual Faraday, que também era um homem pragmático com parcos conhecimentos teóricos, Tesla contribuiu decisivamente para o grande sucesso do eletromagnetismo. Isto nos leva a fazer uma reflexão. A falta de conhecimentos formais de matemática não é, de forma alguma, impedimento para realizar grandes contribuições de caráter matemático em ciências e tecnologia. Na verdade, a matemática não precisa ser simbólica com epsílons e deltas, jargões técnicos e teoremas para ser matemática. Ela se manifesta de várias outras formas, como nas idéias de Faraday e Tesla. A propósito, a matemática não é um privilégio das ciências físicas. Ela também está presente nas artes. Os cânones das Fugas de Johan Sebastian Bach (1685 -1750) e os
310CAPÍTULO 4. LEIS DE COULOMB, AMPÈRE, GAUSS E FARADAY Assim como Maxwell, os Maxwellianos acreditam que havia um meio ubíquo, sem massa, ao mesmo tempo rígido e infinitamente elástico, cognominado éter, que servia de suporte às ondas eletromagnéticas, a exemplo do ar com relação às ondas sonoras. Naquela época, o eletromagnetismo era interpretado de acordo com o modelo da mecânica clássica newtoniana [84].Várias tentativas, entre elas o famoso experimento de Michelson-Morley em 1887, foram realizadas para detectar o éter, mas todas fracassaram. Em 1905, o físico alemão Albert Einstein (1879-1955) em seu famoso artigo ”On the Electrodynamics of Moving Bodies” formulou a Teoria da Relatividade Restrita e com ela estabeleceu que as ondas eletromagnéticas não necessitam de um meio para se propagarem. Com isso o éter foi definitivamente descartado. Com o advento da teoria da relatividade especial, a teoria eletromagnética de Maxwell se solidificou definitivamente, e novas reformulações covariantes das Equações de Maxwell surgiram no decorrer dos anos. [66], [51], [6], [62]
Deixando de lado estas pinceladas de cunho histórico, vamos iniciar a ”dedução” das quatro equações de Maxwell a partir da lei de Coulomb, lei de Ampère, lei de Gauss e lei de Faraday. É bom ter em mente que esta seqüência não é necessariamente a que Maxwell seguiu. Na verdade, só a partir do trabalho de Heaviside é que esta ordem de eventos começou a tomar forma. De qualquer modo é muito difícil seguir rigorosamente o caminho histórico de uma teoria tão rica em detalhes como a do eletromagnetismo. Assim sendo, seguiremos uma visão mais pedagógica do assunto que a precisão histórica propriamente dita.
espelhos mágicos de Maurits Cornelis Escher (1902 - 1972) são tão matemáticos quanto o famoso Teorema da Incompletude (Em qualquer sistema que contenha Aritmética, há afirmações verdadeiras que não podem ser provadas dentro do sistema) de Gödel (Kurt Gödel, 1906 - 1978) [?], [?].
4.3. LEI DE COULOMB
4.3
311
Lei de Coulomb
Em 1875, Coulomb descobriu19 experimentalmente que a força entre duas cargas elétricas pontuais20 , num sistema inercial21 no vácuo, é proporcional ao produto das intensidades das cargas e inversamente proporcional ao quadrado da distância entre elas, tal qual a lei da atração gravitacional descoberta por Newton 150 anos antes. A diferença é que a força gravitacional é sempre atrativa, enquanto que a força de Coulomb pode ser atrativa ou repulsiva, dependendo se as cargas têm sinais contrários ou não. A força de Coulomb tem a direção da diferença dos vetores r e r1 que unem as duas cargas, como mostra a Figura 4.1. Simbolicamente, a força de Coulomb é expressa por q1 q (r − r1 ) . (4.1) F (r) = k |r − r1 |3 No SI a constante de proporcionalidade k é dada por k=
1 , 4π 0
¡ ¢ em que a permissividade do vácuo 0 é igual a 107 / 4πc2 farad/m, sendo c = 299792458 m/s a velocidade da luz no vácuo. Substituindo a constante k em (4.1), obtém-se F (r) =
q1 q 1 (r − r1 ) . 4π 0 |r − r1 |3
(4.2)
A fórmula (4.2), embora de pouco utilidade prática, desempenha papel importantíssimo em eletromagnetismo. Ela serve de ponto de partida para se definir o campo eletrostático de uma carga pontual. Campo elétrico é um dos conceitos fundamentais em eletromagnetismo. Campo eletrostático é um caso especial de campo elétrico, quando este é invariante no tempo. 19
Na verdade, em 1772 Cavendish já tinha descoberto experimentalmente os mesmos resultados encontrados, um século depois, por Coulomb. As experiências de Cavendish só foram publicados em 1879 por Maxwell. 20 Cargas elétricas pontuais é uma maneira simplificada de se referir a corpos eletrizados quando observados a grandes distâncias, comparadas às dimensões geométricas dos corpos. Por exemplo, corpos esféricos de um centímetro de raio são considerados pontuais quando separados a dezenas de metros. Todavia, não são pontuais quando distam de cinco centímetros. A Terra é pontual se observada da Proxima Centauri (estrela mais próxima da Terra, sem contar o Sol). Certamente não será pontual se vista da Lua. 21 Sistema inercial é um sistema de coordenadas em repouso ou em movimento retilíneo e uniforme (velocidade constante).
312CAPÍTULO 4. LEIS DE COULOMB, AMPÈRE, GAUSS E FARADAY
z q
r r
r
r
q F z x
y
y
x Figura 4.1: Representação esquemática da força de Coulomb entre duas cargas. Vamos iniciar com a definição de um campo eletrostático devido a uma carga pontual. Campo eletrostático devido a uma carga pontual q1 , em repouso num sistema inercial, é a força exercida sobre uma carga de prova pontual positiva q, localizada a uma distância r de q1 , dividida pela intensidade da carga de prova. Em termos simbólicos, o campo eletrostático devido a uma carga pontual q1 é definido por: F (r) , E (r) = q em que q é uma carga de prova pontual positiva. Substituindo (4.2) nesta última expressão, obtém-se a fórmula do campo eletrostático de uma carga pontual q1 em termos da intensidade da carga e da distância ao ponto de observação. Portanto, E (r) =
q1 1 (r − r1 ) . 4π 0 |r − r1 |3
(4.3)
O campo eletrostático é um campo vetorial. Isto significa que a cada ponto de R3 associa-se, em torno da carga q1 , um vetor campo elétrico E (r). Em virtude da linearidade de campos vetoriais, o campo eletrostático de duas cargas pontuais é simplesmente a soma vetorial dos campos eletrostáticos
4.3. LEI DE COULOMB
313
z E
r r
r
r
z
z' y' x'
y
y
x
x Figura 4.2: Força de Coulomb devido a uma distribuição contínua de cargas elétricas. de cada carga. Assim, E (r) =
1 q2 (r − r2 ) 1 q1 (r − r1 ) + . 3 4π 0 |r − r1 | 4π 0 |r − r2 |3
Este resultado pode ser facilmente generalizado para um número finito N de cargas pontuais. Com efeito,: N 1 X qn (r − rn ) . E (r) = 4π 0 n=1 |r − rn |3
(4.4)
Quando o número N de cargas pontuais é arbitrariamente grande e infinitamente próximas uma das outras, formando, praticamente, um agregado contínuo, costuma-se representar o número infinito de cargas pontuais por uma distribuição contínua de carga de densidade volumétrica ρ (r), encerrada numa dada região V ⊂ R3 , como ilustra a Figura (4.2). Nesse caso, por um processo de limite, a fórmula (4.4) se converte em Z ρ (r0 ) (r − r0 ) 0 1 dv . (4.5) E (r) = 4π 0 V |r − r0 |3 A fórmula (4.5) e suas versões particulares (4.3) e (4.4) são conhecidas indistintamente como Lei de Coulomb. Pela própria definição, o campo eletrostático é um campo vetorial do tipo campo de força. Nem sempre é fácil determinar o campo eletrostático de uma distribuição volumétrica de cargas elétricas a partir da integral (4.5). A não ser em casos
314CAPÍTULO 4. LEIS DE COULOMB, AMPÈRE, GAUSS E FARADAY
1 0.75 z 0.5
1
0.25
0.5
0 -1
0
y
-0.5 -0.5
0 x
0.5 1
-1
Figura 4.3: Hemisfero com densidade de carga ρ (z) = 4π 0 z. muito especiais em que a distribuição das cargas e o ponto de observação guardam entre si perfeita simetria. O exemplo a seguir mostra um desses casos excepcionais. . Exemplo 4.1 Seja ρ (z) = 4π 0 z C/m3 a densidade de carga elétrica distribuída num hemisfero de raio 1, ilustrado na Figura (4.3). Determinar a componente vertical do campo eletrostático E ao longo do eixo z. Primeiro, vejamos a construção do hemisfero da Figura (4.3): In[1]:= (*--- Figura 4.3: Gráfico do Hhemisfero ---*) Clear[u, v] ParametricPlot3D[{Sin[u] Cos[v], Sin[u] Sin[v], Cos[u]}, {u, 0, Pi/2}, {v, 0, 2 Pi}, AxesLabel -> {”x”, ”y”, ”z”}];
Em virtude da simetria no problema, a integral (4.5) se reduz a uma simples integral de volume. Então, para computá-la basta chamar a função integralDeVolume[expr]vista no segundo capítulo na página 77. Logo, In[7]:= (*--- integralDeVolume[expr]: volume (página 72) ---*)
calcula integrais de
Usando-se o mesmo procedimento empregado nos Exemplo 2.19 e 2.20 (páginas 77 - 78), é fácil computar que a componente Ez num ponto qualquer do eixo z. Com efeito,
4.3. LEI DE COULOMB
315 Ez 2 1.5 1 0.5 z
-6
-4
-2
2
4
6
-0.5 -1 -1.5
Figura 4.4: Campo eletrostático ao longo do eixo z. In[3]:= (*--- campoEz[expr]:
calcula a componente vertical do
campo elétrico E ---*) ampoEz[z1_]:= Module[{x, y, z, r, u, v}, {x, y, z} = {r Sin[u] Cos[v], r Sin[u] Sin[v], r Cos[u]}; fun = z (z - z1)/Sqrt[x^2 + y^2 + (z - z1)^2]^3; integralDeVolume[x, y, z, r, u, v, fun, 0, 1, 0, Pi/2, 0, 2 Pi]]
De posse da função campoEz[expr] podemos traçar o gráfico (Figura 4.4) da componente Ez ao longo do eixo z. Portanto, In[3]:= (*--- Figura 4.4:
Gráfico de Ez al longo do eixo z ---*)
z = Table[i, {i, -6, 6, 1/10}]; Ez = N[Table[campoEz[z[[i]]], {i, Length[z]}]]; ListPlot[Transpose[{z, Ez}], PlotRange -> {-1.5, 2}, PlotJoined -> True, AxesLabel -> {”z”, ”Ez”}]
Em virtude do caráter vetorial da integral (4.5), o seu cálculo é, em geral, impraticável, como já disse antes. Então, o que fazer para se obter o campo eletrostático de uma distribuição arbitrária de cargas elétricas? A saída é simples. Tenta-se, de certo modo, substituir a integral (4.5) por uma equação escalar e a partir dai, indiretamente, determina-se o campo eletrostático. Com isso, o campo vetorial E (r) é temporariamente substituído por um campo escalar V (r), mais simples de ser manuseado algebricamente. Este campo auxiliar é conhecido por campo potencial escalar ou simplesmente
316CAPÍTULO 4. LEIS DE COULOMB, AMPÈRE, GAUSS E FARADAY potencial. No fim, o campo eletrostático reaparece por meio do gradiente do campo potencial. Vejamos então, como esta estratégia se concretiza em termos matemáticos.. Iniciando com (4.5) e efetuando o rotacional de ambos os lados, podemos escrever Z ¡ ¢ (r − r0 ) 0 1 ρ r0 ∇ × dv . ∇ × E (r) = 4π 0 V |r − r0 |3 O rotacional dentro da integral é zero, como pode ser facilmente verificado algebricamente ou, melhor ainda, por meio do Mathematica. Com efeito, In[3]:= (*--- Ativa o pacote Add-on:
Calculus‘VectorAnalysis‘ ---*)
{”x”, ”z”}, Axes -> False, DisplayFunction -> Identity]; In[7]:= (*--- Gera as linhas equipotenciais do dipolo elétrico ---*) Clear[t] r = Sqrt[Sin[t]]; linhasEquip = {-15 r,-7.5 r, -5 r, -3.5 r, -2.5 r, -2 r, -1.5 r, -r, r, 1.5 r, 2 r, 2.5 r, 3.5 r, 5 r, 7.5 r, 15 r}; plotLinhasEquip = PolarPlot[Evaluate[linhasEquip], {t, 0, Pi}, PlotStyle -> Dashing[{0.01, 0.01}], DisplayFunction -> Identity];
De posse dos gráficos das linhas de força e das equipotenciais, vejamos o seu traçado. (Fgura 4.7): 23 Lembre-se que o campo elétrico é o gradiente do potencial e o gradiente, por definição, é normal às linhas equipotenciais.
4.3. LEI DE COULOMB
323
In[8]:= (*--- Figura 4.7: Traça as linhas de força e as equipotenciais de um dipolo elétrico ---*) Show[plotLinhasDeF, plotLinhasEquip, DisplayFunction -> $DisplayFunction];
2 1 z 0 -1 -2 -4
-2
0 x
2
4
Figura 4.7: Linhas de força (cheias) e linhas equipotenciais (pontilhadas) de um dipolo elétrico.
4.3.2
Primeira equação de Maxwell - Lei de Coulomb
Voltemos à Lei de Coulomb (4.3), mas desta feita com a carga q1 situada na origem, q1 ˆ r, E (r) = 4π 0 r2 sendo ˆ r é o vetor unitário na direção do vetor r. r, resulta Efetuando o produto escalar de ambos os lados por 4π 0 r2ˆ r = q1 . 4πr2 0 E · ˆ
(4.19)
Sabendo-se que 4πr2 é a área da superfície de uma esfera de raio r, podemos interpretar esta equação como o fluxo do campo 0 E, normal à superfície de uma esfera, gerado pela carga q1 . Correndo o risco de complicar o óbvio, vamos reescrever a equação (4.19) numa linguagem matemática um pouco mais rebuscada. Assim, Z ( 0 E) · ˆ rds = q1 (4.20) ∂V
em que ∂V é a superfície da esfera de raio r.
324CAPÍTULO 4. LEIS DE COULOMB, AMPÈRE, GAUSS E FARADAY
z
V V
y x Figura 4.8:
Uma das grandes contribuição de Gauss foi observar que a equação (4.20) é válida não só para superfícies esféricas, mas, também, para qualquer superfície fechada orientada.contendo q1 no seu interior. Gauss foi mais longe ainda, descobriu que a equação (4.20) é válida, mesmo que a carga q1 seja substituída por uma distribuição de carga de densidade ρ (x, y, z) em todo o espaço. Neste caso a equação (4.20) toma a forma geral Z Z ( 0 E) · n ˆds = ρdv, (4.21) ∂V
V
em que V é uma região hipotética, limitada pela superfície fecha ∂V , sendo n ˆ o vetor normal à superfície como ilustra a Figura (4.8).
A superfície fechada ∂V da região virtual V é conhecida como superfície de Gauss. Alguns autores preferem chamar a equação (4.21) de lei de Gauss do campo elétrico. Outros a denomina de lei de Coulomb. Preferimos esta segunda denominação, pois (4.21) nada mais é que a generalização da lei de Coulomb (4.19). E a contribuição de Maxwell nessa história? Bom, Maxwell observou que equação (4.21) é válida não apenas para o caso eletrostático, mas também para o caso eletrodinâmico. No entanto, ao contrário do caso eletrostático, ela precisa ser complementada, no caso eletrodinâmico, por outras equações. O grande mérito de Maxwell foi construir uma teoria eletrodinâmica onde a lei de Coulomb é uma das peças fundamentais juntas com outras três
4.4. LEI DE AMPÈRE
325
que veremos a seguir. Com isso, a equação (4.21) corresponde exatamente à primeira equação de Maxwell (1.1) introduzida axiomaticamente no primeiro capítulo. Em muitos livros de eletromagnetismo a lei de Coulomb é apresentada da seguinte maneira Z Z 1 b dσ = ρdv, E·n ∂V
0
V
justificada pelo fato de 0 ser constante. Embora coerente do ponto de vista matemático, esta expressão perde completamente qualquer significado físico quando interpretada no SI. Com efeito, sendo o campo elétrico um campo de força, a integral de superfície, do lado direito, não tem significado físico, pois é inadmissível a integral de superfície de um campo de força. Por outro lado, o campo vetorial 0 E, (C/m2 no SI) é um campo de densidade de fluxo e por conseqüência a equação (4.21) está em completa harmonia com a Física. Observe que o campo 0 E tem a dimensão de densidade de fluxo elétrico. Por isso, vamos denominá-lo de densidade de fluxo pré-elétrico. A razão do sufixo pré será esclarecida mais adiante. Em síntese, 0 não é uma mera constante numérica no SI e por isso mesmo, ela não pode ser transferida arbitrariamente de um lado para o outro da equação. O bloco 0 E é inseparável fisicamente.Acredito que uma das dificuldades que os estudantes enfrentam ao iniciar o estudo do eletromagnetismo é a falta de clareza na distinção entre um campo de força e um campo de fluxo. Esta distinção é vital para se entender e aplicar a teoria eletromagnética no SI. Maxwell foi enfático neste ponto em sua obra A Treatise on Electricity and Magnetism. Infelizmente, os livros modernos não seguem o legado do mestre.
4.4
Lei de Ampère
O dia 11 de setembro de 182024 marca o início do eletromagnetismo como ciência [84]. Após treze anos de intensa pesquisa experimental, Oersted descobriu que uma corrente elétrica estacionária25 , num fio retilíneo, provocava um efeito peculiar na agulha imantada de uma bússola. Verificou que a direção da força que atuava sobre a agulha se dava a noventa graus em relação à direção do fio, como ilustra pitorescamente a Figura (4.9). Oersted também verificou que quando a corrente mudava de sentido, a agulha da 24 25
Cento e oitenta e um dias antes do fatídico 11 de setembro de 2001. Independente do tempo.
326CAPÍTULO 4. LEIS DE COULOMB, AMPÈRE, GAUSS E FARADAY bússola trocava de polaridade. Esta é uma descoberta extraordinária, pois as forças até então conhecidas (atração gravitacional de Newton e a força de Coulomb) eram do tipo radial, isto é, na mesma direção que une as duas cargas (ou massas, no caso da atração gravitacional). Pela primeira vez na ciência, foi registrada uma força do tipo azimutal. Oersted não especificou quantitativamente a lei que acabara de descobrir, se restringindo apenas aos aspectos qualitativos. Todavia, ele concebeu que o efeito observado se estendia continuamente no espaço circunvizinho ao fio com corrente elétrica.
I S S
N
S
N
N
S
S
N
N N
S
N
N S
S
I
Figura 4.9: Esquema ilustrativo do experimento de Oersted.
No dia 18 de setembro de 1820, exatamente uma semana após a revelação26 dos resultados de Oersted, Ampère fez uma exposição na Academia Francesa de Ciências onde relatou que dois fios paralelos se atraem quando correntes elétricas estacionárias fluem no mesmo sentido e se repelem quando fluem em sentidos opostos, como ilustra a Figura (4.10). Durante os três anos seguintes, Ampère aprofundou suas investigações e em 1825 publicou uma série de resultados que, cinqüenta anos mais tarde, causariam profunda influência a Maxwell.
26 Feita por um acadêmico, de nome Arago, da Academia Francesa de Ciências que tinha acabado de retornar de uma viagem ao exterior.
4.4. LEI DE AMPÈRE
327 Z
C2
C1
+
+
l2
I1
l1
r1
I2
r2- r1
z2
r2
z1 y2
Y
x2 y1
x1
X
Figura 4.11: Ação múltipla de duas bobinas de corrente.
I
I
I
I2
Figura 4.10: Esquema do experimento das duas linhas de corrente paralelas feito por Ampère.
Entre estes resultados, sobressai aquele onde Ampère estabeleceu que cada incremento elementar de um circuito exerce uma força sobre qualquer outro incremento elementar de um segundo circuito. Ele denominou de elemento de corrente o produto da corrente estacionária I pelo incremento elementar ∆l, multiplicados pelo vetor tangente unitário. Com isso, Ampère chegou a conclusão que a força elementar exercida por um elemento t1 , de um circuito C1 sobre outro elemento de corrente, de corrente, I1 ∆l1b b I2 ∆l2 t2 , num segundo circuito C2 , como ilustra a Figura (4.11), é expressa quantitativamente do seguinte modo:
328CAPÍTULO 4. LEIS DE COULOMB, AMPÈRE, GAUSS E FARADAY
∆F12
h i b b I ∆l × I ∆l × (r − r ) t t 2 2 2 1 1 1 2 1 μ = 0 4π |r2 − r1 |3
conhecida como lei elementar de Ampère27 . A semelhança na estrutura desta fórmula com a da força de Coulomb (4.1) é impressionante, não obstante a diferença na notação vetorial entre elas. A diferença de notação serve, exatamente, para distinguir a força radial (Coulomb) da força azimutal (Ampère). A constante μ0 é denominada de permeabilidade magnética no vácuo e vale 4π10 H/m no SI. Integrando ∆F12 ao longo dos dois circuitos, obtém-se a força total de um circuito sobre o outro: h i Z Z I2 dl2b b × I dl × (r − r ) t t 2 1 1 1 2 1 μ . F12 = 0 3 4π C2 C1 |r2 − r1 | A esta altura é conveniente identificar um dos circuito como sendo o circuito transmissor e eleger o outro como circuito receptor. É claro que a escolha é totalmente arbitrária. Identificando C1 como o circuito transmissor e C2 como circuito receptor é vantajoso reescrever a integral acima da seguinte maneira: F12
Z
μ I1 = I2 dl2b t2 × 0 4π C2
Z
C1
dl1b t1 × (r2 − r1 ) , |r2 − r1 |3
ou mais concisamente:
F12 = I2
Z
C2
em que B=
μ0 I1 4π
Z
C1
dl2b t2 × B,
dl1b t1 × (r2 − r1 ) . |r2 − r1 |3
(4.22)
(4.23)
A equação (4.22) revela que a força F12 entre os dois circuitos se manifesta indiretamente através da ação do campo vetorial B do circuito transmissor sobre o circuito receptor. O campo vetorial B definido por (4.23) é 27
Na verdade, Ampère não deduziu essa fórmula tal como ela está aí transcrita, pois o cálculo vetorial só seria desenvolvido muitos anos mais tarde. Ele usou outra simbologia matemática, é claro, entretanto, o significado físico era absolutamente idêntico.
4.4. LEI DE AMPÈRE
329
denominado no SI de densidade de fluxo magnético. A equação (4.23) é conhecida como lei de Biot (Jean-Baptist Biot 1774-1862) e Savart (Félix Savart 1791-1841). A unidade de densidade de fluxo magnético no SI é denominada tesla, simbolizada pela letra T. O tesla é uma unidade muito grande, por isso é comum empregar o submúltiplo nanotesla (10−9 T). Ao contrário da lei de Coulomb (4.5) a lei de Biot-Savart (4.23) e muito fácil de ser computada numericamente. Basta especificar a parametrização do circuito, usar o Mathematica e pronto! O programa BiotSavart[expr] calcula o campo B devido a uma bobina de forma arbitrária. In[8]:= (*--- biotSavart[expr] calcula o campo B gerado por uma bobina de forma arbitrária ---*) biotSavart[circuito_,corrente_, x_, y_, z_]:= Module[{n, r12, t, b, integrando, amp = .1 corrente}, r12 = {x, y, z} - circuito; t = D[circuito, u]; Off[NIntegrate::ploss]; integrando = Cross[t, r12]/Sqrt[r12.r12]^3; b[i_, u1_, u2_]:= NIntegrate[integrando[[i]], {u, u1, u2}]; If[x != 0., bx = amp b[1, 0, 2 Pi], bx = 0.]; If[y != 0., by = amp b[2, 0, 2 Pi], by = 0.]; bz = amp b[3, 0, 2 Pi]]
Os exemplos a seguir mostram o uso do programa BiotSavart[expr]. Para efeito de comparação, serão usados duas bobinas de mesma p área e formatos ligeiramente diferentes. A primeira bobina é circular de raio 3/2a e a segunda tem a forma de uma cardióide a(1 + cos u). Primeiro, vamos mostrar que as duas bobinas têm, realmente, áreas idênticas. Com efeito: In[8]:= (*--- Área da bobina círcular ---*) Clear[a] Integrate[u, {u, 0, Sqrt[3/2] a}, {v, 0, 2 Pi}] Out[8]= 3a2 π/2 In[8]:= (*--- Área da bobina tipo cardióide ---*) Clear[a] cardioide = a (1 + Cos[u]); Integrate[v, {u, 0, 2 Pi}, {v, 0, cardioide}] Out[8]= 3a2 π/2
330CAPÍTULO 4. LEIS DE COULOMB, AMPÈRE, GAUSS E FARADAY
-1
1
1
1
0.5
0.5
0.5
-0.5
0.5
1
-1 -0.5
0.5
1
-1 -0.5
0.5
-0.5
-0.5
-0.5
-1
-1
-1
1
Figura 4.12: Comparação entre uma bobina circular e uma outra de tipo cardióide, de mesma área. Tendo verificado que as duas bobinas têm a mesma área, vamos, agora, traçar seus gráficos para efeito de comparação. Fazendo-se a = 1 temos: In[7]:= (*--- Gera o gáfico da bobina círcular ---*) In[7]:= (*--- Gera o gáfico da bobina tipo cardióide ---*) In[7]:= (*--- Gera os gáficos sobrepostos das bobinas circular e do tipo cardióide para fim de comparação ---*) In[10]:= (*--- Figura 4.12:
Gráficos da bobina círcular,
da bobina tipo cardióide e de ambas sobrepostas ---*) Show[GraphicsArray[{plotCirculo, plotCardioide, plotCirCard}], DisplayFunction -> $DisplayFunction];
Agora vejamos alguns exemplos do cálculo do campo B devido a essas duas bobinas. Exemplo 3.1 Calcular as três componentes da densidade de fluxo magnético B no ponto (x, y,pz) = (3/2, 1, 2/3) devido a uma corrente de 1A na bobina circular de raio 3/2 da Figura (4.12). In[10]:= (*--- Calculo de B de uma bobina circular no ponto (3/2, 1, 2/3) ---*) circuitoCircular = {Sqrt[3/2]Cos[u], Sqrt[3/2]Sin[u], 0};
biotSavart[circuitoCircular, 1, 3/2, 2, 2/3]; {bx, by, bz}
4.4. LEI DE AMPÈRE
331
Out[10]:= {91.0517, 60.7011, -25.2468}
Exemplo 4.2 Calcular as três componentes da densidade de fluxo magnético B no ponto (x, y, z) = (3/2, 1, 2/3) devido a uma corrente de 1A na bobina tipo cardioide da Figura (4.12). In[10]:= (*--- Calculo de B de uma bobina do tipo cardióide no ponto (3/2, 1, 2/3) ---*) circuitoCardioide = {(1 + Cos[u]) Cos[u] - 3/4, (1 + Cos[u]) Sin[u], 0};
biotSavart[circuitoCardioide, 1, 3/2, 1, 2/3]; {bx, by, bz} Out[10]:= {100.285, 64.876, -22.9609}
Observa-se que os valores, no mesmo ponto, das componentes do campo B das duas bobinas são desiguais devido à ligeira diferença no desenho das bobinas. É de se esperar que a influência da geometria da bobina decresça com o afastamento do ponto de observação. Este fato é corroborado pelos dois próximos exemplos: Exemplo 3.3 Calcular as três componentes da densidade de fluxo magnético B no ponto (x, y, z) = (10, 5, 1/2) devido a uma corrente de 1A na bobina circular mostrada na Figura (4.12). In[10]:= (*--- Calculo de B de uma bobina circular no ponto (10, 5, 1/2 ---*) Clear[u] circuitoCircular = {Sqrt[3/2]Cos[u], Sqrt[3/2]Sin[u], 0}; biotSavart[circuitoCircular, 1, 10, 5, 1/2]; {bx, by, bz} Out[10]:= {0.041177, 0.0205885, -0.338663}
Exemplo 3.4 Calcular as três componentes da densidade de fluxo magnético B no ponto (x, y, z) = (10, 5, 1/2) devido a uma corrente de 1A nuam bobina tipo cardioide da Figura (4.12). In[16]:= (*--- Calculo de B de uma bobina do tipo cardióide no ponto (10, 5, 1/2 ---*) Clear[u] circuitoCardioide = {(1 + Cos[u]) Cos[u] - 3/4,
332CAPÍTULO 4. LEIS DE COULOMB, AMPÈRE, GAUSS E FARADAY (1 + Cos[u]) Sin[u], 0}; biotSavart[circuitoCardioide, 1, 10, 5, 1/2]; {bx, by, bz} Out[10]:= {0.0421427, 0.0211641, -0.344942}
A seguir veremos que o efeito da geometria sobre os valores de B continua irrelevante a longa distância, mesmo com bobinas bem diferentes das circulares. O programa BiotSavart[expr], embora versátil, só se aplica a circuitos com parametrização cilíndrica ou polar28 . Isto deixa de fora casos importantes como a bobina retangular. Para contornar esta dificuldade apresentamos abaixo o programa retBiotSavart[expr], específico para bobinas retangulares. In[16]:= (*--- retBiotSavart[expr] calcula o campo B gerado por uma bobina retangular ---*) Clear[x, y, z] retBiotSavart[circuito_, corrente_, x_, y_, z_]:= Module[{n, r12, t, b, integrando, xx = circuito[[1]]/2, yy = circuito[[2]]/2, amp = 100 corrente}, Off[NIntegrate::ploss]; (*--- Lado 1 ---*) r12 = {x, y, z} - {u, -yy, 0}; integrando = Cross[{1, 0, 0}, r12]/Sqrt[r12.r12]^3; b[i_, u1_, u2_]:= NIntegrate[integrando[[i]], {u, u1, u2}]; If[x != 0., bx1 = amp b[1, -xx, xx], bx1 = 0.]; If[y != 0., by1 = amp b[2, -xx, xx], by1 = 0.]; bz1 = amp b[3, -xx, xx]; (*--- Lado 2 ---*) r12 = {x, y, z} - {xx, u, 0}; integrando = Cross[{0, 1, 0}, r12]/Sqrt[r12.r12]^3; b[i_, u1_, u2_]:= NIntegrate[integrando[[i]], {u, u1, u2}]; If[x != 0., bx2 = amp b[1, -yy, yy], bx2 = 0.]; If[y != 0., by2 = amp b[2, -yy, yy], by2 = 0.]; bz2 = amp b[3, -yy, yy]; (*--- Lado 3 ---*) r12 = {x, y, z} - {u, yy, 0}; 28 Por isso, na identificação do programa BiotSavart[expr] foi explicitado que ele se aplica a bobinas de formas mais ou menos arbitrárias.
4.4. LEI DE AMPÈRE
333
integrando = Cross[{-1, 0, 0}, r12]/Sqrt[r12.r12]^3; b[i_, u1_, u2_]:= NIntegrate[integrando[[i]], {u, u1, u2}]; If[x != 0., bx3 = amp b[1, -xx, xx], bx3 = 0.]; If[y != 0., by3 = amp b[2, -xx, xx], by3 = 0.]; bz3 = amp b[3, -xx, xx]; (*--- Lado 4 ---*) r12 = {x, y, z} - {-xx, u, 0}; integrando = Cross[{0, -1, 0}, r12]/Sqrt[r12.r12]^3; b[i_, u1_, u2_]:= NIntegrate[integrando[[i]], {u, u1, u2}]; If[x != 0., bx4 = amp b[1, -yy, yy], bx4 = 0.]; If[y != 0., by4 = amp b[2, -yy, yy], by4 = 0.]; bz4 = amp b[3, -yy, yy]; bx = bx1 + bx2 + bx3 + bx4; by = by1 + by2 + by3 + by4; bz = bz1 + bz2 + bz3 + bz4;]
Vamos, agora, empregar o programa retBiotSavart[expr] para comparar as respostas das bobinas circular e retangular.de mesma área, A = 3π/2, do mesmo modo como foi feito com a bobina tipo cardióide, anteriormente. Primeiro, vamos visualizar os gráficos das duas bobinas: In[7]:= (*--- Gera o gáfico da bobina círcular ---*) In[7]:= (*--- Gera o gáfico da bobina retangular ---*) In[7]:= (*--- Gera os gáficos sobrepostos das bobinas círcular e retangular para fim de comparaçãoe ---*) In[10]:= (*--- Figura 4.13:
Gráficos da bobina círcular,
da bobina retangular e de ambas sobrepostas ---*) Show[GraphicsArray[{plotCirculo, plotRetangular, plotCirRet}], DisplayFunction -> $DisplayFunction];
Passemos, então aos exemplos: Exemplo 3.1 Calcular as três componentes da densidade de fluxo magnético B no ponto (x, y, z) = p (3/2, 1, 2/3) devido a uma corrente de 1A na bobina retangular de lados 3π/2 da Figura (??).
334CAPÍTULO 4. LEIS DE COULOMB, AMPÈRE, GAUSS E FARADAY
-1
1
1
1
0.5
0.5
0.5
-0.5
0.5
1
-1
-0.5
0.5
1
-1
-0.5
0.5
-0.5
-0.5
-0.5
-1
-1
-1
1
Figura 4.13: In[10]:= (*--- Calculo de B de uma bobina retangular no ponto (3/2, 1, 2/3) ---*) bobinaRetangular= {Sqrt[3 Pi/2], Sqrt[3 Pi/2]}; (* lados da bobina *) retBiotSavart[bobinaRetangular, 1, 3/2, 2, 2/3]; Out[10]:= {91.0517, 60.7011, -25.2468}
Comparando com o resultado do Exemplo 3.1, pode-se constatar que o efeto da geometria da bobina é bastante grande neste caso. Exemplo 4.3 Calcular as três componentes da densidade de fluxo magnético B no ponto (x, y, z) = (10, 5, 1/2) devido a uma corrente de 1A na bobina retangular mostrada na Figura (4.12). In[10]:= (*--- Calculo de B de uma bobina retangular no ponto (10, 5, 1/2 ---*) bobinaRetangular = {Sqrt[3 Pi/2], Sqrt[3 Pi/2]}; retBiotSavart[bobinaRetangular, 1, 10, 5, 1/2]; Out[10]:= {91.0517, 60.7011, -25.2468}
À longa distância todo gato é pardo. Traduzindo, à longa distância a forma da bobina é irrelevante na determinação de B. Basta comparar os resultados dos Exemplos 3.2, 3.4 e 3.6. Mas é preciso que se faça uma ressalva aqui: para que haja igualdade nos resultados é imprescindível que o produto da área da bobina pela corrente elétrica seja mantido constante. Este ponto é fundamental, como veremos mais adiante. Tanto o programa BiotSavart[expr] quanto o programa para bobinas retangulares retBiotSavart[expr]computam a lei de Biot-Savart (4.23)
4.4. LEI DE AMPÈRE
335
z P , ,z
r r
‘
a
z x
y
y
Figura 4.14: Bobina circular de corrente centrada na origem no plano horizontal. numericamente. A questão agora é saber se, dado um circuito qualquer, é possível resolver a integral de Biot-Savart de forma exata. Isto nem sempre é exeqüível. Entretanto, no caso importantíssimo da bobina circular a resposta é positiva. Suponhamos uma bobina circular de raio a centrada na origem de um sistema de coordenadas cilíndricas como mostra a Figura (4.14). Explorando a simetria da bobina circular, a integral (4.23) se reduz a: μ I B= 0 4π
Z ˆ θ ׈ r0 dl. 02 C r
r0 /r02 podemos reescrevê-la da seguinte maneira: Como ∇ (1/r0 ) = −ˆ μ I B= 0 4π
µ ¶ 1 ˆ ∇ 0 × θdl. r C
Z
Usando-se a identidade: ∇
µ ¶ ˆ 1 ˆ ˆ = ∇ × θ − 1 ∇ × θ, ×θ 0 r r0 r0
b = 0, a integral acima se reduz a: e observando que ∇ × θ μ I B = 0 ∇× 4π
Z
C
dl ˆ θ. r0
336CAPÍTULO 4. LEIS DE COULOMB, AMPÈRE, GAUSS E FARADAY Levando-se em conta a geometria da Figura (4.14), podemos reescrever Z π a cos θdθ μ0 I ˆ p ∇× θ. (4.24) B= 2 2 2π a + ρ + z 2 − 2aρ cos θ 0 É fácil ver que o denominador do integrando pode ser expresso por: s ¶ µ 1 + cos θ 2 2 . (a + ρ) + z − 4aρ 2
e após substituir a variável θ por π − 2α, ele se transforma em: s q 4aρ 2 (a + ρ) + z 2 1 − sin2 α, 2 2 (a + ρ) + z ou simplesmente em:
r p aρ 1 − m sin2 α, 2 m em que o parâmetro m é igual a: m=
(4.25)
4aρ . (a + ρ)2 + z 2
Voltando à integral (4.24) e substituindo o denominador do integrando por (4.25) resulta:. ¡ ¢ Z 0 a 1 − 2 sin2 α dα ˆ p θ, B = μ0 ∇ × p π/2 aρ/m 1 − m sin2 α ou, naturalmente, em: "Z # r Z π/2 π/2 am dα sin2 αdα −μ0 I ˆ p p ∇× −2 θ. B= 2 2 2π ρ 0 0 1 − m sin α 1 − m sin α (4.26) A primeira integral de (4.26) corresponde à integral elíptica completa de primeira espécie K (m) definida por (veja página 436): Z π/2 dα p K (m) = 0 1 − m sin2 α
1 [K (m) − E (m)] em e a segunda integral da mesma expressão é a igual a m que Z π/2 p 1 − m sin2 αdα E (m) = 0
4.4. LEI DE AMPÈRE
337
e a integral elíptica completa de segunda espécie E (m), (veja página 436). 1 Substituindo K (m) e m [K (m) − E (m)] em (4.26) resulta, r i a h³ m´ μ I ˆ 1− K (m) − E (m) θ B = 0 ∇× (4.27) π ρm 2
Finalmente, efetuando o rotacional obtém-se as três componentes da densidade de fluxo magnético B de uma bobina circular de raio a.,
Bρ
µr i¶ m´ a h³ μ0 I ∂ 1− K (m) − E (m) = − π ∂z ρm 2 ¸ ∙ 2z μ0 I a2 + ρ2 + z 2 q E (m) (4.28) = −K (m) + 2 2 4π 2 (a − ρ) + z 2 ρ (a + ρ) + z Bθ = 0,
Bz
(4.29)
µr h³ i¶ aρ m´ μ0 I 1 ∂ 1− K (m) − E (m) = − π ρ ∂ρ m 2 ∙ ¸ 2 a2 − ρ2 − z 2 μ0 I q K (m) + E (m) (4.30) = 4π (a − ρ)2 + z 2 (a + ρ)2 + z 2
em que se usou as identidades (veja página 437):
1 ∂K = [E (m) − (1 − m)K (m)] ∂m 2 (1 − m) m ∂E 1 = [E (m) − K (m)] ∂m 2m
O programa cirBiotSavart[expr] baseado nas fórmulas (4.28 — 4.30) calcula as três componentes cartesianas de B de uma bobina circular de raio a. In[10]:= (*--- cirBiotSavart[expr] calcula o campo B de uma bobina circular de corrente de raio a ---*) cirBiotSavart[a_, corrente_, x_, y_, z_]:= Module[{r, m, ra1, ra2, ra3, br, amp = 100. corrente}, If[a > 0, r= Sqrt[x^2 + y^2];
338CAPÍTULO 4. LEIS DE COULOMB, AMPÈRE, GAUSS E FARADAY m = 4. a r/((a + r)^2 + z^2); ra1 = 2./Sqrt[(a + r)^2 + z^2]; ra2 = (a^2 + r^2 + z^2)/((a-r)^2 + z^2); ra3 = (a^2 - r^2 - z^2)/((a-r)^2 + z^2); If[x != 0 || y!= 0,
br = z ra1/r (-EllipticK[m] + ra2 EllipticE[m]);
bx = amp x br/r, by = amp y br/r, bx = 0.; by = 0.]; bz = amp ra1 (EllipticK[m] + ra3 EllipticE[m]);, True;]]
De posse do programa cirBiotSavart[expr] vejamos como ele funciona em coparação com os exemplos anteriores.: Exemplo 4.5 Repetir o Exemplo 4.1, empregando, desta vez , o programa cirBiotSavart[expr]. In[10]:= (*--- Calculo de B de um circuito circular no ponto (3/2, 1, 2/3) ---*) cirBiotSavard[Sqrt[3/2], 1, 3/2, 1, 2/3]; {bx, by, bz} Out[10]:= {91.0517, 60.7011, -25.2468}
Exemplo 3.6 Repetir o Exemplo 3.3.mas desta vez empregando o programa cirBiotSavart[expr]. In[22]:= (*--- Calculo de B de um circuito circular no ponto (10, 5, 1/2) ---*) campoBcircular[Sqrt[3/2], 1, 10, 1, 1/2]; {bx, by, bz} Out[10]:= {0.041177, 0.0205885, -0.338663}
Como era de se esperar, no caso de bobinas circulares, os programas, BiotSavart[expr] e cirBiotSavart[expr] fornecem os mesmos resultados. Se os resultados são idênticos, por que todo este esforço para se obter o valor exato de B para bobinas circulares? A resposta a esta questão é assunto da próxima seção.
4.4. LEI DE AMPÈRE
4.4.1
339
Dipolo magnético
É conveniente, tanto na teoria como na prática, saber o valor do campo B de uma bobina circular a grande distância, comparada com o raio da bobina. É claro que se pode usar a fórmula (4.27) para isso. Contudo, neste caso particular, existe uma fórmula muito mais simplificada. De fato, usando-se coordenadas esféricas (r, θ, φ) podemos reescrever (4.27) da seguinte maneira: r a μ0 I ˆ ∇× [(1 − m/2) K (m) − E (m)] φ, (4.31) B= π mr sin θ em que ρ = r sin θ e 4ar sin θ . + r2 + 2ar sin θ Re-arranjando os termos desta última expressão, vem: m=
a2
r sin θ =
(4.32)
a2 + r2 + 2ar sin θ m, 4a
e substituindo em (4.31) obtém-se: B=
μ0 I 2a 1 ˆ (4.33) √ ∇× [(1 − m/2) K (m) − E (m)] φ 2 2 π m a + r + 2ar sin θ
Supondo a ¿ r, deduz-se de (4.32) que m → 0. Aplicando as formas assintóticas (veja página 458): µ ¶ 1 9 2 π 1+ m+ m , lim K (m) = m→0 2 4 64 e π lim E (m) = m→0 2
µ ¶ 1 9 m2 1− m− . 4 64 3
da integrais elípticas K (m) e E (m), podemos escrever, lim [(1 − m/2) K (m) − E (m)] =
m→0
πm2 32
Substituindo este limite na equação(4.33) resulta: B=
³ πm ´ 1 μ0 Ia ˆ ∇× √ φ π a2 + r2 + 2ar sin θ 16
Aplicando o valor de m dado por (4.32), obtemos:
(4.34)
340CAPÍTULO 4. LEIS DE COULOMB, AMPÈRE, GAUSS E FARADAY
B=
1 μ0 Ia2 ∇× √ 2 2 4 a + r + 2ar sin θ
µ
r sin θ a2 + r2 + 2ar sin θ
¶
ˆ φ,
ou simplesmente: B=
r sin θ μ0 Ia2 ˆ ∇× φ. 2 2 4 (a + r + 2ar sin θ)3/2
Para se obter as componentes Br , Bθ e Bφ basta efetuar o rotacional em coordenadas cilíndricas. Assim:
Br = =
Bθ
! Ã μ0 Ia2 1 ∂ r sin θ 4 r sin θ ∂θ (a2 + r2 + 2ar sin θ)3/2 ¢ ¡ μ0 Ia2 2a2 + 2r2 + ar sin θ cos θ , 4 (a2 + r2 + 2ar sin θ)5/2
à ! r2 sin θ μ0 Ia2 1 ∂ = − 4 r ∂r (a2 + r2 + 2ar sin θ)3/2 ¢ ¡ μ0 Ia2 2a2 − r2 + ar sin θ sin θ = − , 4 (a2 + r2 + 2ar sin θ)5/2 Bφ = 0.
Como a ¿ r estas componentes se reduzem a: Br = Bθ =
μ0 2mz cos θ, 4π r3
(4.35)
μ0 mz sin θ, 4π r3
(4.36)
Bφ = 0.
(4.37)
em que foi feita a seguinte substituição mz = Iπa2 . A tabela (4.1) mostra a analogia entre as fórmulas (4.13 — 4.15) do dipolo elétrico e as fórmulas (4.31 — 4.33) que acabamos de obter. Comparando este dois conjuntos de fórmulas, nota-se a estrutura matemática semelhante que
4.4. LEI DE AMPÈRE
341
Dipolo Elétrico Er = 4π1 0 2p r3 cos θ Eθ =
1 p 4π 0 r3
sin θ
Eφ = 0
Dipolo Magnético μ0 2mz Br = 4π r3 cos θ Bθ =
μ0 mz 4π r3
sin θ
Bφ = 0
Tabela 4.1: Comparação dos dipolos elétrico e magnético existe entre eles. Por esta razão, uma bobina circular de corrente, satisfazendo a condição a ¿ r, é denominado de dipolo magnético de momento mz = Iπa2 . O subscrito z em mz indica a direção do dipolo, perpendicular à área da pobina. É fácil deduzir de (4.35) e (4.36) as componentes cartesianas Bx , By , Bz . do dipolo magnético vertical. Com efeito: Bx =
3mz xz μ0 4π (x2 + y 2 + z 2 )5/2
3mz yz μ0 4π (x2 + y2 + z 2 )5/2 ¡ ¢ μ0 mz 2z 2 − x2 − y 2 Bz = 4π (x2 + y 2 + z 2 )5/2 By =
(4.38)
(4.39)
(4.40)
A dualidade entre os dipolos elétrico e magnético nos permite usar as equações semelhantes a (4.17) e (4.18 ) para traçar as linhas de fluxos do dipolo magnético. Procedendo como no caso do dipolo elétrico, podemos escrever In[26]:= (*--- Ativa o pacote Add-On:
Graphics‘Graphics‘ ---*)
Identity];
342CAPÍTULO 4. LEIS DE COULOMB, AMPÈRE, GAUSS E FARADAY No lugar das equipotenciais (Figura 4.7) é mais interessante, no caso do dipolo magnético, visualizar o campo de vetores corresponde a B. Como se sabe, o campo de vetores é normal às equipotenciais, e portanto tangente às linhas de fluxo. Na verdade, as linhas de fluxo e o campo de vetores são diferentes representações da mesma quantidade física, o campo de densidade de fluxo magnético. Vejamos os gráficos: In[30]:= (*--- Ativa o pacote Add-On: (Tanh[100 #]&), PlotRange -> {{-4.3, 4.3}, {-2.8, 2.8}}, RotateLabel -> False, FrameLabel -> {”x”, ”z”}, Frame -> True, DisplayFunction -> Identity]; In[32]:= (*--- Figura 4.15: Linhas de fluxo e campo de vetores B de um dipolo magnético ---*) Show[plotCampoVetorB, plotFluxo, DisplayFunction -> $DisplayFunction];
2 1 z 0 -1 -2 -4
-2
0 x
2
4
Figura 4.15: Linhas de fluxo e campo de vetores de um dipolo magnético.
4.4. LEI DE AMPÈRE
343
A Figura (4.15) lembra uma fotografia muito comum nos livros de eletromagnetismo básico, mostrando limalhas de ferro semeadas sobre uma folha de papel, sob a ação de um imã (dipolo magnético). O programa dipoloMagneticoB[expr], codificado a partir das fórmulas (4.38) - (4.40), calcula as três componentes cartesianas do campo B (em nT) de um dipolo magnético na direção z. In[32]:= (*--- dipoloMagneticoB[expr] calcula as três componentes em nT do campo B de um dipolo magnético ---*) dipoloMagnetico[mz_, x_, y_, z_]:= Module[{r}, r = Sqrt[x^2 + y^2 + z^2]; If[r != 0, If[x != 0 || y != 0, bx = 300. mz x z/r^5; by = 300. mz y z/r^5, bx = 0, by = 0.]; bz = 100. momento (2 z^2 - x^2)/r^5;,True;]]
Eis uma questão importante em eletromagnetismo: a que distância do centro de uma bobina, os valores do campo B da bobina e de um dipolo magnético, localizado no centro da bobina, têm aproximadamente a mesma magnitude? Em outras palavras, a que distância do centro de uma bobina se pode substituir a bobina por um dipolo magnético cujo momento seja igual à área da bobina multiplicada pela corrente? Ou ainda, em que condições as equações (e4.38 - e4.40) podem ser substituídas por (e4.28 - e4.30), na prática? Vamos responder a esta questão graficamente no Exemplo 4.5 com as bobinas circular e retangular dos Exemplos 4.3 e 4.4. Para tanto, vamos usar os programas cirBiotSavart[expr], retBiotSavart[expr] e dipoloMagneticoB[expr] Exemplo 4.5 Calcular a componente Bz da bobina p circular de raio p r = 3/8, da bobina retangular de lados a = b = 3π/8 e do dipolo magnético vertical mz = 3π/8, nos eixo x (y = z = 0), com x variando de 2r a 10r, sendo r o raio da bobina circular. In[32]:= (*--- Calcula as respostas Bz da bobina circular, da bobina retangular e do dipolo magnético vertical,---*) n = 36; a = Sqrt[3/2];
344CAPÍTULO 4. LEIS DE COULOMB, AMPÈRE, GAUSS E FARADAY x = 3/2; mz = 3 Pi/2; xa = Table[0, {i,n}]; cirB = xa; retB = xa; dmvB = xa; corrente = 1; Do[ cirBiotSavart[a, corrente, x, 0., 0.]; cirB[[i]] = bz; bobina = {Sqrt[3Pi/2], Sqrt[3Pi/2]}; retBiotSavart[bobina, corrente, x, 0., 0.]; retB[[i]] = bz; dipoloMagneticoBz[mz, x, 0., 0.]; dmvB[[i]] = bz; xa[[i]] = x;
x = x + a/5, {i,n}] In[47]:= (*--- Ativa o pacote Add-On: {Dashing[{0.02, 0.02}]}, DisplayFunction -> Identity]; plotRet = LogListPlot[Transpose[{xa, Abs[retB]}], PlotJoined -> True, PlotStyle -> {Dashing[{0.01, 0.01}]}, DisplayFunction -> Identity]; plotDmv = LogListPlot[Transpose[{xa, Abs[dmvB]}], PlotJoined -> True, DisplayFunction -> Identity]; In[50]:= (*--- Figura 4.16: Traça os gráficos das respostas Bz da bobina, circular da bobina retangular e do dipolo magnético vertical ---*) Show[{plotCir, plotRet, plotDmv}, DisplayFunction -> $DisplayFunction];
Observando a Figura (4.16) chegamos a conclusão que a partir de seis raios (raio da bobina circular) de distância, a resposta Bz do dipolo magnético (momento igual a área da bobina circular multiplicado pela corrente),
4.4. LEI DE AMPÈRE
345
Bz 100 50 20 10 5 2 1 x/r 0
2
4
6
8
10
Figura 4.16: Comparação da resposta Bz da bobina circular (linha tracejada), da bobina retangular (linha pontilhada) e do dipolo magnético vertical (linha cheia),. da bobina circular e da bobina retangular (de mesma área) são praticamente, iguais. O ponto importanto é que à longa distância a geometria da bobina é irrelevante.
4.4.2
Segunda equação de Maxwell - Lei de Ampère
Iniciamos com o cálculo do campo B devido a uma linha infinita de corrente contínua,29 como mostra a Figura (4.17). Levando-se em consideração a simetria radial da linha de corrente, a equação (4.23) se resume a μ I B= 0 4π Como ˆ z׈ r = sin αb θ, segue que
μ I Bθ = 0 4π
29
Z
∞
ˆ z׈ r dl. 2 −∞ r
Z
∞
−∞
sin αdl . r2
A rigor, uma linha infinita de corrente é uma idealização matemática. Fisicamente, uma linha infinita de corrente pode ser materializada por um dos lados de uma bobina retangular em que os outros três lados estão suficientemente afastados do ponto onde se faz a observação do campo.
346CAPÍTULO 4. LEIS DE COULOMB, AMPÈRE, GAUSS E FARADAY
I ,,
)
>
P( z
r >
l
r
Figura 4.17: Linha infinita de corrente na direção z. De acordo com a geometria da Figura (4.17), observa-se que cos α = sin β e l = ρ tan β em que ρ = r cos β. Sendo assim, conclui-se que dl =
ρ dβ. cos2 β
e por conseqüência a integral acima se transforma em Z μ I π/2 cos3 βdβ Bθ = 0 , 4π −π/2 ρ cos β e por fim, podemos escrever Z
μ I Bθ = 0 4πρ
π/2
cos βdβ =
−π/2
μ0 I 2πρ
Multiplicando os dois lados por 2πρ/μ0 , obtém-se 2πρ
Bθ =I μ0
(4.41)
Como 2πρ é o comprimento da circumferência de raio ρ centrada na origem, podemos reescrever (4.41) do seguinte modo Z
C
B ˆ · tdl = I, μ0
em que o caminho C é exatamente a circunferência de raio ρ.
4.4. LEI DE AMPÈRE
347
Esta integral é conhecida como lei de Ampère aplicada a uma linha infinita de corrente contínua. Ela explica, claramente, o resultado da experiência de Oersted citada no início deste capítulo. Se no lugar de uma única linha de corrente tivéssemos uma infinidade delas constituindo um contínuo de densidade J, na direção z e seção S, ter-se-ia, por superposição, Z Z B ˆ · tdl = J ·ˆ zds, C μ0 S em que o caminho C é uma circunferência em torno da distribuição de corrente. Maxwell generalizou esse resultado de Ampère em duas etapas: Na primeira etapa, ele supôs que o campo B, de densidade de fluxo magnético, e o campo J, de densidade de corrente contínua, se estendiam continuamente por todo o espaço e afirmou que Z Z B ˆ · tdl = J ·n ˆds, (4.42) ∂S μ0 S qualquer que fosse a superfície fictícia aberta e orientável S com fronteira ∂S. A segunda etapa foi um passo mais sutil. Mais do que isso, foi um passo de gênio30 . Maxwell observou que se a densidade de corrente J não fosse contínua e sim dependente do tempo, a equação (4.42) não estaria completa. Algo estava faltando na equação. Ele concluiu que a equação teria que ser complementada com um termo até então desconhecido do ponto de vista experimental. Em outras palavras, em dois mil anos de observações de fenômenos elétricos e magnéticos, nenhum fenômeno tinha sido observado, até então, que justificasse o termo que Maxwell se referia. Provavelmente, motivado pela lei de Faraday31 , ele imaginou corretamente que o termo que faltava no lado direito de (4.42) seria exatamente este aqui Z ∂ ˆds, − 0E · n ∂t S e assim, a lei de Ampère deveria ser escrita na forma completa, Z Z Z ∂ B ˆ · tdl − ˆds = J ·n ˆds. 0E · n ∂S μ0 S ∂t S 30
(4.43)
Na história da humanidade, poucas vezes alguém teve uma idéia tão brilhante. Mais adiante, falaremos sobre essa conjectura. Muitos historiadores têm estado com afinco as razões que levaram Maxwell a incluir na lei de Ampère este termo complementar. 31
348CAPÍTULO 4. LEIS DE COULOMB, AMPÈRE, GAUSS E FARADAY A complementação da lei de Ampère foi um toque de gênio, como já disse. Sem tal complementação seria impossível construir uma teoria eletromagnética coerrente. Em particular não teria sentido falar em ondas eletromagnéticas, visto que o termo acrescido é justamente o responsável por este tipo de onda. Maxwell desvendou o segredo, mas foi Hertz quem observou as ondas eletromagnéticas pela primeira vez. A esta altura seria interessante reler as página 350 - 352. Em muitos livros de eletromagnetismo a lei de Ampère é apresentada da seguinte maneira: Z
∂S
B ·ˆ tdl − μ0
0
Z
S
∂E ·n ˆds = μ0 ∂t
Z
S
J ·n ˆds.
justificada pelo fato de μ0 e 0 serem constantes. Embora coerente do ponto de vista matemático, esta expressão perde completamente qualquer significado físico quando interpretada no SI. Com efeito, sendo B um campo densidade de fluxo, de linha do lado direito do lado direito não tem significado físico, pois é inadmissível a integral de linha de um campo de densidade de fluxo. Do mesmo modo, a integral de superfície do lado direito perde completamente o seu significado físico em virtude de E ser um campo de força. Por outro lado, o campo B/μ0 (A/m no SI) é um campo de força e o campo 0 E, (C/m2 no SI) é um campo de densidade de fluxo e por conseqüência a equação (4.43) está em completa harmonia com a Física. Observe que o campo B/μ0 tem a dimensão de campo magnético. Por isso, vamos denominá-lo de campo pré-magnético. A razão do sufixo pré será esclarecida mais adiante. Em síntese, μ0 não é uma mera constante numérica no SI e por isso mesmo, ela não pode ser transferida arbitrariamente de um lado para o outro da equação. O bloco B/μ0 é inseparável fisicamente tal qual 0 E. Veja o comentário na página 355.
4.5
Lei de Gauss
Para efeito de motivação vamos iniciar com alguns exemplos exploratórios. Em todos os exemplos, vamos determinar o valor da integral Z B·n ˆ ds, (4.44) S
em que B é o campo de densidade de fluxo magnético de um dipolo magnético ou de uma bobina circular e S, uma superfície fechada e orientada de vários tipos..
4.5. LEI DE GAUSS
349
O calculo de (4.44) nos exemplos a seguir será feito com o programa integralDeSuperficie[expr] introduzido no segundo capítulo (página 62). Não custa nada reescrevê-lo aqui. In[1]:= (*--- integral de superficie *) integralDeSuperficie[x_, y_, z_, u_, v_, fx_, fy_, fz_, u0_, u1_, v0_, v1_]:= Module[{jacobianoYZ, jacobianoZX, jacobianoXY}, jacobianoYZ = Det[Outer[D, {y, z}, {u, v}]]; jacobianoZX = Det[Outer[D, {z, x}, {u, v}]]; jacobianoXY = Det[Outer[D, {x, y}, {u, v}]]; Integrate[fx jacobianoYZ + fy jacobianoZX + fz jacobianoXY, m{u, u0, u1}, {v, v0, v1}]]
Exemplo 4.6 Dado o campo B de um dipolo magnético vertical (4.35 - 4.37), localizado na origem, deseja-se calcular (4.44), sendo S a superfície de um paralelepípedo retangular de lados a, b e c. Primeiro, vejamos como traçar o paralelepípedo. Fixando a = 2.5, b = 2 e c = 3 temos, In[2]:= (*--- Ativa o pacote Add-On: { ”x”, ”y”, ”z”}]];
y 0 -0.5
1 -1 0.5
x 0 1
-1
1
z
0
-1
Figura 4.18: In[3]: Paralelepípedo retangular centrado na origem.
350CAPÍTULO 4. LEIS DE COULOMB, AMPÈRE, GAUSS E FARADAY Agora vamos calcular a integral (4.44). De posse das componentes do dipolo magnético (4.35 - 4.37) junto com a parametrização de cada face do paralelepípedo.podemos escrever, In[3]:= (*--- Exemplo 4.6: Cálculo do fluxo de um dipolo magnético na direção z através de um paralelepípedo de lados a, b e c ---*) Clear[a, b, c, x, y, z, u, v] {bx, by, bz} = {3 x z/(x^2 + y^2 + z^2)^(5/2), 3 y z/(x^2 + y^2 + z^2)^(5/2), (2 z^2 - x^2 - y^2)/(x^2 + y^2 + z^2)^(5/2)}; {x, y, z} = {a, u, v}; int1 = integralDeSuperficie[x, y, z, u, v, bx, by, bz, -b, b, -c, c]; {x, y, z} = {-a, u, v}; int2 = integralDeSuperficie[x, y, z, u, v, bx, by, bz, b, -b, -c, c]; {x, y, z} = {u, b, v}; int3 = integralDeSuperficie[x, y, z, u, v, bx, by, bz, -a, a, -c, c]; {x, y, z} = {u, -b, v}; int4 = integralDeSuperficie[x, y, z, u, v, bx, by, bz, a, -a, -c, c]; {x, y, z} = {u, v, c}; int5 = integralDeSuperficie[x, y, z, u, v, bx, by, bz, -a, a, -b, b]; {x, y, z} = {u, v, -c}; int6 = integralDeSuperficie[x, y, z, u, v, bx, by, bz, a, -a, -b, b]; int1 + int2 + int3 + int4 + int5 + int6 Out[3]= 0
O resultado é igual a zero. Isto significa que o fluxo magnético total através da superfície do paralelepípedo, neste exemplo, é identicamente nulo. Note que em virtude da simetria do paralelepípedo obteríamos o mesmo resultado se o dipolo tivesse sido orientado na direção x ou y em vez da direção z. Um dipolo orientado numa direção qualquer pode ser decomposto vetorialmente em três componentes cartesianas, segue dai que a integral (4.44) continuaria igual a zero qualquer que fosse a orientação do dipolo magnético. Observe que adotamos mz = 4π/μ0 , pois a magnitude do dipolo é irrelevante neste problema.
4.5. LEI DE GAUSS
351
No segundo e terceiro exemplos vamos usar uma superfície menos simétrica. Exemplo 4.7 Dado o campo B de um dipolo magnético vertical (4.35 - 4.37), localizado na origem, deseja-se calcular (4.44), sendo S a superfície ilustrada na Figura (??) ou seja, uma esfera secionada pelo um plano horizontal. In[3]:= (*--- Exemplo 4.7:
Cálculo do fluxo de um dipolo magnético na
direção z através de uma esfera seccionada ---*) Clear[x, y, z, u, v] {bx, by, bz} = {3 x z/(x^2 + y^2 + z^2)^(5/2), 3 y z/(x^2 + y^2 + z^2)^(5/2), (2 z^2 - x^2 - y^2)/(x^2 + y^2 + z^2)^(5/2)}; {x, y, z} = {u Cos[v], u Sin[v], a Sqrt[2]/2}; fluxoDisco = integralDeSuperficie[x, y, z, u, v, bx, by, bz, 0, a Sqrt[2]/2, 0, 2 Pi] // FullSimplify; {x, y, z} = {a Sin[u] Cos[v], a Sin[u] Sin[v], a Cos[u]}; fluxoEsfera = integralDeSuperficie[x, y, z, u, v, bx, by, bz, Pi/4, Pi, 0, 2 Pi] // FullSimplify; fluxoSuperficie = fluxoDisco
+ fluxoEsfera
Out[3]= 0
Novamente, o fluxo total de B é identicamente nulo. Exemplo 4.7 Repetir o exemplo anterior, mas com o dipolo orientado na direção x, isto é, paralelo ao plano que intercepta a esfera, em vez de perpendicular ao plano. In[3]:= (*--- Exemplo 4.7:
Cálculo do fluxo de um dipolo magnético na
direção x através de uma esfera seccionada ---*) Clear[x, y, z, u, v] {bx, by, bz} = {(2 x^2 - y^2 - z^2)/(x^2 + y^2 + z^2)^(5/2), 3 x y/(x^2 + y^2 + z^2)^(5/2), 3 x z/(x^2 + y^2 + z^2)^(5/2)}; {x, y, z} = {u Cos[v], u Sin[v], a Sqrt[2]/2}; fluxoDisco = integralDeSuperficie[x, y, z, u, v, bx, by, bz, 0, a Sqrt[2]/2, 0, 2 Pi] // FullSimplify; {x, y, z} = {a Sin[u] Cos[v], a Sin[u] Sin[v], a Cos[u]}; fluxoEsfera = integralDeSuperficie[x, y, z, u, v, bx, by, bz, Pi/4, Pi, 0, 2 Pi] // FullSimplify;
352CAPÍTULO 4. LEIS DE COULOMB, AMPÈRE, GAUSS E FARADAY fluxoSuperficie = fluxoDisco
+ fluxoEsfera
Out[3]= 0
Mais uma vez, o fluxo total é igual a zero. É claro se a orientação do dipolo fosse na direção y o resultado seria absolutamente o mesmo. Sendo igual a zero nas três direções, é óbvio que o fluxo total seria zro qualquer que fosse a direção do diplolo magnético. Nos três exemplos anteriores desposemos o dipolo magnético no interior da superfície fechada. No próximo exemplo vamos considerá-lo no lado de fora da superfície fechada. Exemplo 4.8 Dado o campo B de um dipolo magnético vertical (4.35 - 4.37), localizado na origem, deseja-se calcular (4.44), sendo S a superfície do toro (Figura ??) do Exemplo 2.17 (página 73). In[3]:= (*--- Exemplo 4.8:
Cálculo do fluxo de um dipolo magnético na
direção z através de um toro da Figura 2.28 ---*) Clear[x, y, z, u, v] {bx, by, bz} = {3 x z/(x^2 + y^2 + z^2)^(5/2), 3 y z/(x^2 + y^2 + z^2)^(5/2), (2 z^2 - x^2 - y^2)/(x^2 + y^2 + z^2)^(5/2)}; {x, y, z} = {(2 + Cos[u]) Cos[v], (2 + Cos[u]) Sin[v], Sin[u]}; integralDeSuperficie[x, y, z, u, v, bx, by, bz, 0, 2 Pi, 0, 2 Pi] // Simplify Out[3]= 0
O resultado dispensa comentário. Exemplo 4.9 Repetir o exemplo anterior com o dipolo orientado na direção y. In[3]:= (*--- Exemplo 4.9:
Cálculo do fluxo de um dipolo magnético na
direção x através de um toro ---*) Clear[x, y, z, u, v] {bx, by, bz} = {3 x y/(x^2 + y^2 + z^2)^(5/2), (2 y^2 - x^2 - z^2)/(x^2 + y^2 + z^2)^(5/2), 3 y z/(x^2 + y^2 + z^2)^(5/2)}; {x, y, z} = {(2 + Cos[u]) Cos[v], (2 + Cos[u]) Sin[v], Sin[u]}; integralDeSuperficie[x, y, z, u, v, bx, by, bz, 0, 2 Pi, 0, 2 Pi] // Simplify
4.5. LEI DE GAUSS
353
Out[3]= 0
Análogo aos casos anteriores, o fluxo seria igual a zero quaquer que fosse a orientação do dipolo. Com esses resultados, podemos conjecturar que a integral de fluxo (4.44) será sempre igual a zero. Será que realmente isto é verdade? Vamos analisar mais um exemplo, com uma superfície fechada mais retorcida. Exemplo 4.10 Dado o campo B de um dipolo magnético vertical (4.35 - 4.37), localizado na origem, deseja-se calcular (4.44), sendo S a superfície do caracol (Figura ??) do Exemplo 2.18 (página 74). In[3]:= (*--- Exemplo 4.10 Cálculo do fluxo de um dipolo magnético na direção z através de caracol da Figura 2.29 ---*) Clear[x, y, z, u, v] {bx, by, bz} = {3 x z/(x^2 + y^2 + z^2)^(5/2), 3 y z/(x^2 + y^2 + z^2)^(5/2), (2 z^2 - x^2 - y^2)/(x^2 + y^2 + z^2)^(5/2)}; {x, y, z} = {8 Pi/5 + u Cos[v], 0, u Sin[v]}; fluxoDisco = integralDeSuperficie[x, y, z, u, v, bx, by, bz, 0, 2 Pi/5, 2 Pi, 0]; {x, y, z} = {u Cos[u](4 + Cos[u + v])/10, u Sin[u](4 + Cos[u + v])/10, u Sin[u + v]/10}; fluxoCaracol = integralDeSuperficie[x, y, z, u, v, bx, by, bz, 0, 4 Pi, 0, 2 Pi]; fluxoTotal = fluxoDisco + fluxoCaracol Out[3]= 0
Como era de se esperar, o fluxo total permanece igual a zero. E se mudarmos a fonte? Isto é, e se no lugar do dipolo magnético usássemos uma bobina, por exemplo. É uma boa idéia. Nos próximos três exemplos, a fonte do campo magnético será uma bobina circular de vários diâmetros e, então, veremos o que acontece. Para tornar o problema ainda mais interessante, usaremos para o cálculo do fluxo uma superfície fechada S constituída por dois cilindros concêntricos vedados no topo e na base como ilustra a Figura (4.19). A figura também mostra uma bobina circular de corrente circundando externamente o cilindro. Pata traçar o gráfico da superfície dos dois cilindros e da bobina circundante basta executar o seguinte programa:.
354CAPÍTULO 4. LEIS DE COULOMB, AMPÈRE, GAUSS E FARADAY 2
y 0 -2 2 1 z
0 -1 -2 -2 0 x 2
Figura 4.19: Superfície fechada constituída por dois cilindros concêntricos, envolvida por um loop circular de corrente. In[3]:= (*--- Figura 4.18: Superfície cilíndrica fechada circundada por uma bobina de corrente contínua ---*) base = {u Cos[v], u Sin[v], -2}; cilInt = {Cos[u], Sin[u], v};
cilExt = {2 Cos[u], 2 Sin[u], v}; teto = {u Cos[v], u Sin[v], 2}; loop = {u Cos[v], u Sin[v], 0}; Show[{ParametricPlot3D[Evaluate[{base, teto}], {u, 1, 2}, {v, 0, 2 Pi}, DisplayFunction -> Identity], ParametricPlot3D[Evaluate[loop], {u, 2.49, 2.51}, {v, 0, 2 Pi }, PlotPoints -> 40, DisplayFunction -> Identity], ParametricPlot3D[Evaluate[{cilInt, cilExt}], {u, 0, 2 Pi}, {v, -2, 2}, DisplayFunction -> Identity]}, AxesLabel -> {”x”, ”y”, ”z”}, DisplayFunction -> $DisplayFunction];
Para efeito de escala vamos considerar o raio do cilindro interno igual a uma unidade, o raio do cilindro externo duas unidades, a altura do cilindro é igual a quatro unidades. O raio da bobina terá três valores distintos: a) duas e meia unidades, b) uma e meia unidades, c) meia unidasde. Exemplo 4.11 Dado o campo B (4.28 - 4.30) de uma bobina circular de corrente externa aos dois cilindros concêntricos vedados no topo e na base
4.5. LEI DE GAUSS
355
da Figura (4.19), deseja-se calcular o valor da integral de fluxo magnético (4.39). In[3]:= (*--- Exemplo 4.11 Cálculo do fluxo de uma bobina circular externa aos dois cilindros fechados da Figura 4.18 ---*) Clear[x, y, z, u, v] a = 2.5; r = Sqrt[x^2 + y^2]; m = 4.a r/((a + r)^2 + z^2); br = 2 z/(r^2 Sqrt[(a + r)^2 + z^2]) (-EllipticK[m] + (a^2 + r^2 + z^2) EllipticE[m]); {bx, by, bz} = Evaluate[{x br, y br, 2/Sqrt[(a + r)^2 + z^2] (EllipticK[m] + (a^2 - r^2 - z^2)/((a - r)^2 + z^2) EllipticE[m])}]; {x, y, z} = {u Cos[v], u Sin[v], -2}; intBase = N[integralDeSuperficie[x, y, z, u, v, bx, by, bz, 1, 2, 2 Pi, 0]]; {x, y, z} = {u Cos[v], u Sin[v], 2}; intTopo = N[integralDeSuperficie[x, y, z, u, v, bx, by, bz, 1, 2, 0, 2 Pi]]; {x, y, z} = {Cos[u], Sin[u], v}; intInt = integralDeSuperficie[x, y, z, u, v, bx, by, bz, 2 Pi, 0, -2 , 2]; {x, y, z} = {2 Cos[u], 2 Sin[u], v}; intExt = integralDeSuperficie[x, y, z, u, v, bx, by, bz, 0, 2 Pi, -2 , 2]; intBase + intTopo + intInt + intExt Out[3]= 0
Nada mudou, o fluxo continua zero, independente do tipo da fonte. Exemplo 4.12 Repetir o exemplo anterior considerando o raio da bobina igual a uma unidade e meia, isto é, a bobina entre os dois cilindros. In[7]:= (*--- Exemplo 4.12; Cálculo do fluxo magnético de uma bobina circular localizada entre os dois cilindros fechados da Figura 4.18 ---*) Out[3]= 0
A posição da bobina parece não afetar o resultado. Vejamos, então, o último caso, o da bobina de raio igual a meia unidade.
356CAPÍTULO 4. LEIS DE COULOMB, AMPÈRE, GAUSS E FARADAY Exemplo 4.13 Repetir o exemplo anterior considerando o raio do loop igual a meia unidade. In[7]:= (*--- Exemplo 4.13; Cálculo do fluxo magnético de uma bobina circular localizada dentro do cilindro interno da Figura 4.18 ---*) Out[3]= 0
Todos esses exemplos confirmam o que realmente é observado na prática. O fluxo magnético através de uma superfície fechada orientada é sempre zero, independentemente do tipo de fonte da densidade de fluxo magnético B. Esta é a essência da lei de Gauss.
4.5.1
Terceira equação de Maxwell - Lei de Gauss
Os exemplos que acabamos de ver sugere que Z
∂V
B·n ˆ ds = 0,
(4.45)
independentemente da fonte de corrente e da superfície fechada ∂V que limita a região V do espaço tridimensional. Gauss partindo do princípio que não existe na natureza fontes magnéticas isoladas concluiu que o fluxo da componente normal de B através de qualquer superfície fechada e orientada é nulo. Isto significa que o fluxo que entra por uma parte da superfície sai integralmente por outra parte, em virtude da ausência de fontes e sorvedouros isolados no interior da região limitada pela superfície fechada. Maxwell apenas acrescentou que dado um campo B definido em toda região do espaço, a lei de Gauss (4.45) é válida para qualquer superfície fictícia fechada e orientada contida na região. Observe que a formulação matemática da lei de Gauss tem a mesma estrutura da lei de Coulomb (4.21). A diferença é que na lei de Gauss não existem fontes isoladas, enquanto que na lei de Coulomb, as cargas elétricas são fontes isoladas de fluxo elétrico. É importante atentar para a dualidade entre o campo de densidade de fluxo magnético B na lei de Gauss e o campo de densidade de fluxo pré-elétrico 0 E da lei de Coulomb. Em outras palavras, B está para a lei de Gauss assim como 0 E está para a lei de Coulomb. Esta é a razão porque muitos autores denominam a lei de
4.6. LEI DE FARADAY
357
Coulomb de lei de Gauss do fluxo elétrico e a lei de Gauss, propriamente dita, de lei de Gauss do fluxo magnético.
4.6
Lei de Faraday
Oersted e Ampère descobriram experimentalmente que corrente elétrica dá origem a campo magnético32 . E o processo inverso? Será que campo magnético gera corrente elétrica? Após investigar cuidadosamente a questão, Faraday descobriu que campo magnético por si só não gera corrente elétrica, entretanto a variação do campo magnético, sim, gera corrente elétrica. Na época de Faraday, a mecânica newtoniana exercia forte influência nas demais ciências. O princípio da ação à distância, central à mecânica newtoniana, era também o paradígma da teoria eletromagnética de Gauss e Weber. Ambos, como a maioria dos cientistas, acrediatavam piamente que os fenômenos elétricos e magnéticos eram regidos por essa lei. Faraday, entretanto, relutava em aquiescer ao princípio da ação à distância. Ele acreditava que a interação entre corpos eletrificados ou magnetizados se dava por meio de linhas de força ou linhas de fluxo. Para ele, era como se o espaço, em torno de corpos eletrificados ou magnetizados, fosse preenchido por um tecido fibroso que servia de suporte às forças elétricas ou magnéticas exercidas por esses corpos. Essas idéias impíricas tiveram grande influência na obra de Maxwell. Ele traduziu o conceito de linhas de força e de fluxo numa linguagem matemática precisa, dando origem ao conceitos de campo elétrico e campo de densidade de fluxo magnético. Maxwell acreditava que estes campos era resultado do estado de tensão do meio, na presença de corpos eletrificados ou magnetizados. Hoje, a versão einsteinana é que tudo não passa de deformaões geométrica no espaço tetra-dimensional33 . Faraday acreditava que no espaço entre os pólos positivo e negativo de dois imãs existiam linhas de fluxo magnético. Uma bobina receptora se movimentando na região entre os dois imãs indicava a presença de corrente elétrica toda vez que a inclinação da bobina variava com relação à direção do fluxo. A intensidade da corrente era máxima quando o plano da bobina se encontrava normal à direção do fluxo. Gradativamente a intensidade da corrente ia diminuindo à medida que o plano da bobina se inclinava.Quando a bobina permanecia estática, nenhuma corrente elétrica era observada na 32
A ser definido mais adiante. No momento sabemos apenas o que é um campo prémagnético. 33 Na verdade, a teoria mais moderna (teoria das cordas) afirma que o espaço tem dez dimensões, das quais quatro sobressaem em relação às outras seis[?]. De certo modo, por trás dessas teorias mais exóticas estão as idéias pioneiras de Faraday.
358CAPÍTULO 4. LEIS DE COULOMB, AMPÈRE, GAUSS E FARADAY bobina. Faraday verificou que quando os dois imãs se distanciavam ou se aproximavam um do outro, a intensidade da corrente na bobina receptora também mudava de intensidade, mesmo que a bobina permanecesse estática. Com essas observações, Faraday concluiu que a presença de corrente na bobina receptora se devia à variação da quantidade de linhas de fluxo que atravessava o plano da bobina. Quanto mais linha de fluxo atravessa o plano da bobina tanto mais intensa será a corrente. Quando dois imãs se deslocam um do outro, provocam variação das linhas de fluxo e conseqüentemente surge uma voltagem que gera corrente na bobina. Se o plano da bobina gira em relação à direção do fluxo magnético, aparece também uma voltagem, mesmo que os dois imãs estejam imóveis. A Figura (4.20) ilustra esquematicamente estas observações.
V
V
V
( a) x
x V
( b)
Figura 4.20: a) Voltagem numa bobina receptora fixa entre dois imãs que se distanciam continuamente.. b) Voltagem numa bobina receptora que gira entre dois imãs imóveis. Na Figura (4.20a) observa-se que o deslocamento das bobinas modifica a densidade de fluxo e por conseqüência a intensidade de corrente na bobina normal à direção do fluxo também varia. Se os imãs se distanciam a intensidade de corrente diminui, se se aproximam, a corrente aumenta. Na Figura (4.20b) os imãs estão estacionários e a bobina gira em torno de um eixo normal à direção do fluxo magnético. A intensidade de corrente varia linearmente com o valor da área efetivamente atravessada pelo fluxo. A
4.6. LEI DE FARADAY
359
corrente é máxima quando a área se encontra perpendicular à direção do fluxo. A corrente se anula quando o plano da bobina coincide com a direção di fluxo. Se a bobina orientada gira uniformemente, a variação da corrente será senoidal. Faraday tinha pleno conhecimento das experiências de Ampère e sabia muito bem que corrente elétrica em uma bobina criava linhas de fluxo magnético em torno da bobina. Com isso, Faraday verificou que seria mais simples gerar linhas de fluxo com bobinas que com imãs. Para tanto, bastava dispor de uma bobina transmissora com corrente elétrica oscilante, como mostra esquematicamente a Figura (4.21). Z
B
Y
X
Figura 4.21: Uma bobina tramsmissora com corrente elétrica oscilante gera um campo de densidade de fluxo magnético também oscilante. Assim, uma bobina receptora nas imediações de uma bobina transmissora com corrente oscilante, experimenta efeitos semelhantes aos verificados com imãs. Uma constatação importante feita experimentalmente por Faraday é que quando a variação do fluxo magnético se dava no sentido positivo, a voltagem na bobina receptora era negativa e quando o sentido da variação do fluxo tornava-se negativo a voltagem na bobina passava a ser positiva. Em outras palavras, o sinal da voltagem na bobina receptora é sempre contrário ao sinal da variação do fluxo magnético. Isto se deve ao princípio de inércia, reagir sempre ao contrário das mudanças. A natureza é pródiga neste aspecto. E nós homens, também. Afinal de contas fazemos parte da natureza.
4.6.1
Quarta equação de Maxwell - Lei de Faraday
Com base nas observações de Faraday pode-se dizer que a variação temporal do fluxo magnético, através de uma bobina lhe induz uma voltagem com o
360CAPÍTULO 4. LEIS DE COULOMB, AMPÈRE, GAUSS E FARADAY sinal trocado.Traduzindo em linguagem simbólica tem-se, Z ∂ ∆V = − B·n ˆ ds, ∂t S em que S é a área contornada pela bobina. Maxwell, na sua análise, chegou à conclusão que o potencial eletrostático definido por (4.7) pode ser estendido, naturalmente, a campos eletrodinâmicos. Assim, podemos escrever Z ∆V = E ·ˆ tdl, C
em que C representa o contorno da bobina. Comparando essas duas expressões de ∆V chega-se simbolicamente à lei proposta por Faraday, Z Z ∂ ˆ E · tdl = − B·n ˆ ds ∂t S C em que C é o contorno da bobina de área S. Maxwell foi muito mais além ainda. Como sempre, na sua teoria, ele não se limitava a bobinas e a circuitos reais, junto com seus respectivos campos. Ao contrário, ele admitia que todo o espaço era preenchido pelos campos E e B, numa abstração matemática do tecido fibroso de linhas de força e de fluxo de Faraday. Assim, dada uma superfície aberta orientada fictícia qualquer, Maxwell generalizou a lei de Faraday nesses termos, Z
∂S
E ·ˆ tdl +
∂ ∂t
Z
S
B·n ˆds = 0
(4.46)
em que ∂S é a fronteira, também orientada, da superfície aberta hipotética S. O grande mérito de Maxwell foi deduzir que no regime eletrodinâmico a Lei de Coulomb (4.21), a Lei de Ampère generalizada (4.43), a Lei de Gauss (4.45) e a Lei de Faraday (4.46) formam um sistema acoplado de equações integrais. São exatamente essas equações as que formam a primeira versão das Equações de Maxwell, no SI, apresentada de forma axiomática no primeiro capítulo34 . 34 A bem da verdade, Maxwell não seguiu exatamente os passos aqui apresentados para deduzir as suas famosas equações (em número de vinte, como sabemos). Entretanto, ele,
4.7. EQUAÇÃO DA CONTINUIDADE
Z
Z
0E
∂V
∂S
∂ B ˆ · tdl − μ0 ∂t
Z
∂S
Z
0E
S
Z
·n ˆ ds = ·n ˆ ds =
361
Z
ρdv,
(4.47)
J ·n ˆ ds,
(4.48)
V
Z
S
B.ˆ nds = 0,
(4.49)
B·n ˆ ds = 0.
(4.50)
∂V
E ·ˆ tdl +
∂ ∂t
Z
S
Mais uma vez, chamo atenção para a simplicidade e elegância dessas quatro equações. A primeira e a segunda são heterogêneas, elas contêm as fontes na forma de cargas e correntes elétricas.As duas últimas são homogêneas. Assim, as quatro equações formam dois pares de duas equações 35 . A menos da fonte no lado direito, a primeira equação de ambos os pares tem a mesma estrutura matemática e física. Da mesma maneira, a segunda equação, nos dois pares, tem o mesmo formato, a menos do lado direito, obviamente. Foi, provavelmente, por essa semelhança física e matemática que R ∂ E · n ˆ ds levou Maxwell incluir na equação original de Ampère o termo ∂t 0 S R ∂ que corresponde ao termo ∂t S B · n ˆds na lei de Faraday.
4.7
Equação da Continuidade
O campo vetorial J, de densidade de corrente elétrica, e o campo escalar ρ, de densidade de carga elétrica, que fazem parte das fontes nas equações da lei influenciado por Faraday, sempre raciocinava em termos de campo de força e campo de densidade de fluxo, chegando até a formular suas idéias na forma de integrais de superfície e de linha, antes mesmo de deduzir as equações finais na forma diferencial. Por isso, acredito que iniciar com as equações de Maxwell na forma integral é o caminho mais elucidativo para se entender a física do eletromagnetismo 35 Com um pouco mais de sofisticação matemática mostra-se que o primeiro par é equivalente a uma única equação tensorial e o segundo par a uma segunda equação tensorial. Assim, as quatro equações são apenas duas na linguagem da álgebra tensorial ou Com um pouco mais de sofisticação matemática mostra-se que o primeiro par é equivalente a uma única equação tensorial e o segundo par a uma segunda equação tensorial. Assim, as quatro equações são apenas duas na linguagem da álgebra tensorial ou equivalentemente no formalismo das formas diferenciais. Sofisticando ainda mais a matemática, prova-se com a álgebra de Clifford que as quatro equações vetoriais (ou as duas tensoriais) de Maxwell se reduzem a apenas uma única equação! no formalismo das formas diferenciais. Sofisticando ainda mais a matemática, prova-se com a álgebra de Clifford que as quatro equações vetoriais (ou as duas tensoriais) de Maxwell se reduzem a apenas uma única equação! [?]
362CAPÍTULO 4. LEIS DE COULOMB, AMPÈRE, GAUSS E FARADAY de Coulomb (4.47) e a da lei de Ampère (4.48), respectivamente, satisfazem a equação Z Z ∂ ρdv, (4.51) J ·n ˆds = − ∂t V ∂V denominada de equação de continuidade. Esta equação é conseqüência imediata da lei de Coulomb e da lei de Ampère. Com efeito, supondo ∂S fixa no tempo, a lei de Ampère (4.48) pode ser reescrita da seguinte maneira, ! Z Ã ∂ B − ·n ˆ ds = 0, (4.52) ∇× 0E − J μ0 ∂t ∂S onde se fez uso da identidade, ! Z Ã Z B ˆ B · tdl, ∇× ·n ˆ ds = μ μ ∂S ∂S 0 0 conseqüência direta do Teorema de Stokes (2.94). Como o integrando de (4.52) é uma função contínua e a integral é válida para qualquer caminho fechado ∂S, o Teorema do Integrando Nulo (página 164) nos garante que ∇×
∂ B − 0 E − J = 0. μ0 ∂t
Aplicando o operador divergência nesta expressão, vem −∇ ·
∂ 0 E = ∇ · J, ∂t
em virtude da identidade ∇ · ∇ × F = 0, qualquer que seja o campo vetorial F. Integrando na região V ambos os lados desta expressão, podemos reescrevêla assim Z Z ∂ ˆ ds = J ·n ˆds (4.53) − 0E · n ∂t ∂V ∂V onde se fez uso das identidades, Z Z ∇ · 0 Edv = ˆds, 0E · n VZ Z∂V ∇ · Jdv = J ·n ˆds, V
∂V
4.8. CAMPOS MICROSCÓPICOS E MACROSCÓPICOS
363
conseqüência imadiata do Teorema de Gauss (2.92). Finalmente, aplicando a lei de Coulomb (4.47) no lado direito de (4.53) obtém-se a equação da continuidade na forma integral (4.51). Para se obter a equação da continuidade na forma diferencial basta aplicar o Teorema de Gauss no lado direito de (4.51) e em seguida usar o Teorema do Integrando Nulo. Procedendo assim, podemos escrever, ∇·J=−
4.8
∂ρ . ∂t
(4.54)
Campos microscópicos e macroscópicos
Nas equações (4.47 - 4.50), o meio eletromagnético é representado pelas cargas ρ e pelas correntes J. Sem dúvida, visto desta maneira, meio eletromagnético é um tanto quanto abstrato. Para se ter uma visão mais concreta do conceito de meio eletromagnético é preciso compreender o comportamento físico das cargas ρ e correntes J. Veremos que as primeiras são de dois tipos distintos e a segunda, são de três tipos diferentes. Saber distinguí-las é fundamental na compreensão da teoria e principalmente, nas aplicações práticas do eletromagnetismo de um modo geral e em geofísica em particular.. As cargas ρ se dividem em cargas livres ρf e cargas de polarização ρp . As cargas livres são aquelas que se movimentam livremente sob a ação de campos eletromagnéticos. Por outro lado, as cargas de polarização praticamente não se deslocam. Sofrem apenas ligeiros deslocamentos sob a ação de campos eletromagnéticos. Um meio onde há predominância de cargas livres é conhecido como meio condutivo ou condutor. Os que apresentam predominância de cargas de polarização são denominados de dielétricos. Um dielétrico sob a ação de um campo eletromagnético é caracterizado por um campo de densidade de fluxo P , conhecido como campo de polarização elétrica. Imaginando-se uma região fictícia V num dielétrico nãouniforme, a polarização elétrica causa deslocamento infinitesimal de cargas de polarização através da superfície fechada ∂V que envolve a região, como ilustra a Figura (4.22). O total de cargas de polarização que atravessa a superfície fechada fictícia ∂V é expresso por Z P ·n ˆdv. qp = ∂V
Como o dielétrico é neutro, o total de carga que atravessa a superfície é contabalançado pela deficiência de carga na região interior à superfície, ou
364CAPÍTULO 4. LEIS DE COULOMB, AMPÈRE, GAUSS E FARADAY
P
P
P P
dV
P P
P
P
Figura 4.22: Polarização não-uniforne de um dielétrico seja, qp = − Assim, podemos escrever, Z ∂V
Z
V
ρp dv.
P ·n ˆ dv = −
Z
V
ρp dv.
(4.55)
Substituindo este resultado na lei de Coulomb (4.41) vem, Z Z Z ρf dv, ˆds + P ·n ˆdv = 0E · n ∂V
∂V
V
em virtude de ρ = ρf + ρp . Devido a linearidade da integral de superfície, podemos escrever Z ³ Z ´ ρf dv, ˆds = 0E + P · n ∂V
ou simplesmente,
V
Z
∂V
D·n ˆds =
Z
V
ρf dv,
(4.56)
em que o campo vetorial D = 0 E + P é denominado de campo de densidade de fluxo elétrico, expresso em C/m2 no SI. Eis aí porque denominamos 0 E de campo de densidade de fluxo pré-elétrico. No vácuo, os campos elétrico e pré-elétrico são idênticos. Nos demais, eles são diferentes, de acordo com as características da polarização elétricas do meio.
4.8. CAMPOS MICROSCÓPICOS E MACROSCÓPICOS
365
As cargas livres ρf dão origem às correntes elétricas livres Jf e as cargas de polarização geram as correntes elétricas de polarização Jp . Além de Jf e Jp também existem as chamadas correntes magnética Jm , associadas às correntes devido ao movimento dos eletrons em torno do núcleo atômico, dando origem a uma distribuição contínua de dipolos magnéticos infinitesimais. A exemplo da polarização elétrica associada a campos elétricos, os dipolos magnéticos também se polarizam na presença de fluxos magnéticos. Este fenômeno é denominado de magnetização. Sabendo-se que J = Jf + Jp + Jm resta determinar a contribuição de cada uma dessas parcelas da corrente no cômputo do fluxo total através de uma superfície fechada fictícia qualquer. Primeiro, vamos determinar a contribuição de Jp em termo do campo de densidade de polarização P . Em seguida determinaremos a contribuição de Jm e Jf . É facil ver que a equação da continuidade (4.51) também se aplica às cargas e correntes de polarização. Assim, Z Z ∂ Jp · n ˆ ds = − ρ dv, ∂t V p ∂V e por conta de (4.55), resulta Z Z ∂ Jp · n ˆds = P ·n ˆ dv. ∂t ∂V ∂V
(4.57)
Agora vejamos a contribuição da corrente magnética. A exemplo do campo de polarização elétrica P , uma distribuição contínua de dipolos magnéticos forma um campo vetorial M , denominado de campo de magnetização. Em analogia à lei original de Ampère (4.42) é perfeitamente plausível que o campo de magnetização satisfaça a seguinte equação, Z Z ˆ ds, (4.58) M ·b tdl = Jm · n ∂S
S
em que S é uma superfície aberta orientada. De posse dos resultados (4.57) e (4.58) podemos reescrever a lei de Ampère (4.43) da seguinte maneira Z
∂S
B ˆ ∂ · tdl − μ0 ∂t
Z
S
ˆ ds = 0E · n
Z
S
ˆds + Jf · n
∂ ∂t
Z
∂V
P ·n ˆdv +
Passando as duas últimas integrais para o lado esquerdo,
Z
∂S
M ·ˆ tdl.
366CAPÍTULO 4. LEIS DE COULOMB, AMPÈRE, GAUSS E FARADAY
Z
∂S
Ã
B −M μ0
!
Z ³
∂ ·ˆ tdl − ∂t
S
0E
´
+P ·n ˆds =
Z
S
ˆds, Jf · n
e denominando o campo B/μ0 −M de campo magnético H, podemos escrever Z Z Z ∂ b b ds, b ds = (4.59) H · tdl − D·n Jf · n ∂t S ∂S S
em que se usou a definição da densidade de fluxo elétrico D = 0 E + P , vista anteriormente. O campo magnético H = B/μ0 − M tem a dimensão de A/m no SI. Eis ai porque denominamos o B/μ0 de campo pré-magnético. No vácuo, os campos magnético e pré-magnético são idênticos. Nos demais, eles são diferentes, de acordo com as características das polarizações elétrica e magnética do meio. Substituindo a equação (4.47) por (4.56) e a equação (4.48) por (4.59) chega-se à segunda versão das equações de Maxwell apresentadas axiomaticamente no primeiro capítulo. Z
Z
∂S
Z
∂S
H ·ˆ tdl −
∂ ∂t
∂V
D·n ˆ ds =
S
D·n ˆ ds =
Z
Z
Z
ZV
S
ρf dv,
(4.60)
ˆds, Jf · n
(4.61)
B.ˆ nds = 0,
(4.62)
B·n ˆ ds = 0.
(4.63)
∂V
E ·ˆ tdl +
∂ ∂t
Z
S
Note que a lei de Gauss e a de Faraday não sofreram nenhuma modificação na passagem da primeira para a segunda versão, pois ambas independem das fontes ρ e J. Uma vez estabelecidas as relações D = 0 E + P e H = B/μ0 − M , o sistema de equações (4.47 - 4.50) é absolutamente equivalente ao sistema (4.60 - 4.63), isto é, a primeira versão é equivalente à segunda versão. Na segunda versão, a elegância das equações de Maxwell torna-se muito mais destacada, se compararmos com a primeira. Agora, o campo de densidade de fluxo magnético B tem um companheiro dual, o campo de densidade de fluxo elétrico D. Ambos, sendo campos de densidade de fluxo, eles se associam à integrais de superfície fechadas. O campo elétrico E, por sua vez, também tem seu companheiro dual. O campo magnético H. Os dois são campos de força e conseqüentemente se associam à integrais de linha.
4.9. MEIO SIMPLES
4.9
367
Meio simples
A interação dos campos E, B, D e H com a matéria é, em geral, bastante complexa. A experiência mostra que em muitas situações a relação entre essas quatro quantidades satisfaz a seguinte equação matricial constitutiva [37], à ! ∙ ! ¸Ã D ξ E = . ζ μ B H Um meio é dito linear quando satisfaz a esta equação matricial. Todavia, em muitos materiais lineares observa-se que ξ = ζ = 0 e por conseqüência, o sistema matricial se desacoplam em duas equações constitutivas, D= E
(4.64)
B = μH
(4.65)
e nas quais representa a permissividade elétrica (farad/m) e μ a permeabilidade magnética (henry/m) do meio. No vácuo, = 0 e μ = μ0. Os materiais que satisfazem a essas duas últimas relações constitutiva formam os chamados meio simples. Neste livro só trataremos de meio simples. Em geofísica, as rochas se comportam como meio simples. Substituindo as relações constitutivas (4.64) e (4.65) nas equações de Maxwell (4.60 - 4.63) obtemos a terceira versão das equações de Maxwell. Com efeito,
Z Z
Z
∂ H ·ˆ tdl − ∂t ∂S Z
∂ E ·ˆ tdl + ∂t ∂S
∂V
E·n ˆds =
S
E·n ˆds =
Z
Z
V
Z
S
ρf dv,
(4.66)
ˆds, Jf · n
(4.67)
μH · n ˆds = 0,
(4.68)
∂V
μH · n ˆds = 0.
(4.69)
S
Z
É importante enfatizar esta versão das equações de Maxwell é muito mais restritiva do que as duas primeiras. Ela só é válida para meios simples. Por exemplo, elas não se aplicam a meios lineares e muito menos a meio não-lineares.
368CAPÍTULO 4. LEIS DE COULOMB, AMPÈRE, GAUSS E FARADAY
4.10
Formulações integral e diferencial
Não obstante a importância da forma integral das equações de Maxwell para se entender os fundamentos do eletromagnetismo, ela é de uso restrito nas aplicações práticas. Normalmente, os problemas de física-matemática são formulados com equações diferenciais e o eletromagnetismo não seria diferente. Por isso, vamos traduzir as equações (4.66 - 4.69) para a formulação diferencial. Aplicando o teorema de Gauss (2.92) na lei de Coulomb (4.66) Z Z ∇ · Edv = ρf dv, V
V
e supondo que E e ρf sejam funções contínuas qualquer que seja a região V , segue do Teorema do Integrando Nulo (página ) que ∇ · E = ρf . Esta é lei de Coulomb na formulação diferencial. Aplicando-se o Teorema de Stokes (2.24) na primeira integral do lado direito da lei de Ampére (4.67), resulta # Z Z " ∂ E ˆ ds, Jf · n ∇×H − ·n ˆ ds = ∂t S S e supondo que H, E e Jf sejam funções contínuasqualquer que seja a superfície fechada S, segue pelo Teorema do Intervalo Nulo que, ∇×H −
∂ E = Jf , ∂t
Esta é a lei de Ampère na formulação diferencial. Empregando-se o mesmo argumento usado acima na lei de Coulomb, mostra-se que a lei de Gauss na formulação diferencial é ∇ · μH = 0. Seguindo ipsis litteris os argumentos empregados na lei de Ampère, mostra-se facilmente que a lei de Faraday na formulação diferencial é ∇ × E−
∂μH =0 ∂t
4.10. FORMULAÇÕES INTEGRAL E DIFERENCIAL
369
Assim, as quatro equações de Maxwell, na formulação diferencial constituem o sistema,
∇ · E = ρf , ∂ E = Jf , ∂t ∇ · μH = 0,
∇ × H−
∇ × E−
∂μH ∂t
= 0,
(4.70) (4.71) (4.72) (4.73)
apresentado axiomaticamente, equações (1.13 - 1.16), no primeiro capítulo. Será que o sistema de equações de Maxwell na formulação diferencial (4.70 - 4.73) é equivalente ao sistema (4.66 - 4.69) na forma integral? Claro que não. Na dedução de (4.70 - 4.73) foi exigida a continuidade dos campos de fluxos E e μH e dos campos de força E e H para assegurar a aplicação do Teorema do Integrando Nulo. Assim, as equações na forma integral são menos restritivas que as equações na forma diferencial, pois aquelas não demandam a continuidade dos campos E, μH, E e H. A continuidade de E e μH bem como a de E e H está diretamente associada à continuidade das propriedades elétricas e μ dos diferentes meios. Na interface de dois meios de propriedades 1 , μ1 e 2 , μ2 , as equações (4.70 - 4.73) perdem sentido matemático, devido a impossibilidade de derivar funções nos pontos de descontinuidade. Então, como devemos proceder nestes pontos de descontinuidade? A saída é recorrer às equações na forma integral.. Iniciando com a lei de Coulomb (4.66), consideremos uma região cilíndrica arbitrariamente pequena de altura ∆h e área transversal ∆A na fronteira de dois meios de permissividade 1 e 2 , como ilustra a Figura (4.23a).
>
370CAPÍTULO 4. LEIS DE COULOMB, AMPÈRE, GAUSS E FARADAY n
E
A >
h
n
E
>
(a)
E
n
A
B
D
C
h l
E (b) Figura 4.23: (a) Superfície cilíndrica fechada interceptando a fronteira de dois meios de propriedades elétricas distintas. (b) Superfície retangular aberta perpendicular à interface de dois meios eletricamente diferentes. Como, por hipótese, a região cilíndrica é arbitrariamente pequena, podemos expressar a lei de Coulomb da seguinte maneira, n2 ∆A+ 1 E1 ·ˆ n1 ∆A+o 2 E2 ·ˆ
fluxo através da superfície cilíndrica ρf ∆A∆h.
Dividindo ampos os lados da equação por ∆A, resulta ³
2 E2 −
´ ˆ = ρs E 1 1 ·n
(4.74)
em que ρs = lim ρf ∆h, quando ∆h → 0, é a densidade superficial de carga elétrica na interface. O fluxo através da superfície cilíndrica lateral se anula n2 = n ˆ. quando ∆h → 0. Note que n ˆ 1 = −ˆ A equação (4.74) nos diz que na interface de dois meios de permissividades elétrica distintas,.a componente normal do fluxo elétrico é descontínua. E a componente normal do fluxo magnético também é descontínua? Não, na fronteirade dois meios de permeabilidade magnética distintas, a componente normal do fluxo magnético é contínua. De fato, usando-se a lei Gauss
4.10. FORMULAÇÕES INTEGRAL E DIFERENCIAL
371
(4.59) e procedendo de forma inteiramente análoga ao caso anterior mostrase facilmente que, ³ ´ μ2 H2 − μ1 H1 · n ˆ=0 (4.75)
Sabendo-se como se comportam os fluxos E e μH na fronteira de dois meios, vamos agora investigar como se comportam os campos E e H. Primeiro vejamos o campo E e depois o campo H. Para iniciar, suponhamos uma superfície aberta retangular arbitrariamente pequena de largura ∆l e altura ∆h prpendicular à interfacede dois meios, como mostra a Figura (4.23b). Como, por hipótese, ∆h é suficientemente pequeno, a lei de Faraday (4.60) se resume a t2 ∆l − E1 · ˆ t1 ∆l + a contribuição nos dois lados verticais = 0, E2 · ˆ
onde se levou em consideração o fato da integral de superfície ser nula em virtude da área do retângulo tender rapidamente para zero. A contribuição da integral de linha nos lados verticais do retângulo também se anula quando ∆h → 0. Logo, ´ ³ t = 0, E2 − E1 · ˆ
t1 = ˆ t. Esta expressão também pode ser escrita assim, sendo ˆ t2 = −ˆ ´ ³ (4.76) n ˆ × E2 − E1 = 0,
em que o vetor unitário n ˆ normal à superfície de separação dos dois meios aponta do meio um para o meio dois, como ilustra a Figura (4.23b). A expressão (??) afirma que na fronteira de dois meios a componente tangencial do campo elétrico é contínua. Agora, aplicando a lei de Ampère e procedendo de forma inteiramente análoga ao caso anterior, tem-se, t2 ∆l − H1 · ˆ t1 ∆l + a contribuição nos dois lados verticais = Jf ∆l∆h, H2 · ˆ
sabendo-se que a integral de superfície se anula em virtude da área do retângulo tender rapidamente para zero. A contribuição da integral de linha nos lados verticais do retângulo também se anula quando ∆h → 0. Dividindo os dois lados por ∆l e reconhecendo que lim Jf ∆l quando ∆l → 0 é a densidade superficial de correntes livres Js , podemos escrever ´ ³ n ˆ × H2 − H1 = Js . (4.77)
372CAPÍTULO 4. LEIS DE COULOMB, AMPÈRE, GAUSS E FARADAY Finalmente, agrupando as equações (4.74), (4.77), (3.72) e (4.76) na mesma ordem das equações (4.70 - 4.73) obtem-se as equações de Maxwell na forma pontual, válidas apenas onde há descontinuidades nas propriedades elétricas, ´ ³ = ρs , (4.78) n ˆ · 2 E2 − 1 E1 ³ ´ n ˆ × H2 − H1 = Js , (4.79) ´ ³ = 0, (4.80) n ˆ · μ2 H2 − μ1 H1 ³ ´ n ˆ × E2 − E1 = 0,. (4.81)
Note que estas equações lembram as equações de Maxwell na forma diferencial (4.70 - 4.73). Com efeito, nas leis de Coulomb e de Gauss, o símbolo (ˆ n·) faz o papel do operador divergência. Nas leis de Ampère e Faraday, o símbolo (ˆ n×) faz o papel do rotacional. As derivadas no tempo desaparecem por conta da anulação das integrais de superfície nas leis de Ampère e Faraday. Como já foi dito antes, as equações (4.78 - 4.81) são, também, equações de Maxwell restritas aos pontos de descontinuidade de dois meios.
4.11
Domínio do tempo
É comum nas aplicações de eletromagnetismo o uso de fontes externas de energia eletromagnética. Em geofísica, por exemplo, emprega-se transmissores ou antenas de vários tipos para auscultar eletromagneticamente o subsolo, com vista à prospecção mineral, exploração de hidrocarbonetos e estudos hidrogeológicos. A questão é como identificar nas equações de Maxwell as correntes de um transmissor externo. A resposta está nas correntes livres Jf que integra a equação de Ampère (4.62) De fato, havendo uma fonte externa, podemos separar as correntes livres em correntes ômicas Johm e correntes Jtx , associadas ao transmissor. As correntes ômicas satisfazem a lei de Ohm, Johm = σ E,
(4.82)
sendo σa condutividade elétrica do meio, expressa em siemens/m no SI. As correntes ômicas também são chamadas de correntes de condução ou correntes induzidas. Com a especificação das correntes do transmissor Jtx , a quarta versão das equações de Maxwell introduzida de modo axiomático no primeiro capítulo,
4.12. DOMÍNIO DA FREQÜÊNCIA
373
toma a seguinte forma: ∇ · E = ρf , ∇×H −
∂ E − σ E = Jtx , ∂t ∇ · μH = 0,
∇×E−
∂μH ∂t
= 0,
(4.83) (4.84) (4.85) (4.86)
em que Jf = σ E + Jtx . As propriedades elétricas σ, e μ são invariantes no tempo mas não no espaço. Nos pontos onde há descontinuidades nos parâmetros elétricos σ, e μ as equações (4.65 - 4.68) perdem a validade. Nestes pontos, elas devem ser substituídas por, ´ − E E 2 2 1 2 ´ ³ n ˆ × H2 − H1 ´ ³ n ˆ · μ2 H2 − μ1 H1 ³ ´ n ˆ × E2 − E1 n ˆ·
³
= ρs ,
(4.87)
= Js ,
(4.88)
= 0,
(4.89)
= 0.
(4.90)
Na fronteira entre meios condutivos, a componente normal do fluxo elétrico (4.69) é sempre descontinua mesmo que a permissividade seja contínua. Nos bons condutores a permissividade elétrica é aproximadamente igual a 0 . Se as condutividades de dois meios contíguos forem finitas e não haja fontes externas na fronteira, a densidade de corrente superficial Js , na interface dos dois meios, se anula [4]. Nesse caso a componente tangencial do campo magnético é contínua.
4.12
Domínio da freqüência
Nesta última etapa vamos falar um pouco sobre as correntes Jtx do transmissor. Como se sabe, essas correntes constituem a fonte externa de energia eletromagnética. A interação de campos eletromagnéticos com o meio é, em geral, bastante complexa. Por isso é vantajoso manter a variação das correntes do transmissor o mais simples possível. Quanto mais complexas
374CAPÍTULO 4. LEIS DE COULOMB, AMPÈRE, GAUSS E FARADAY forem as correntes Jtx , mais complicados serão os campos eletromagnéticos, e por conseqüência, mais confusa será a interação dos campos com o meio. Correntes harmônicas (senoidal) são as mais simples e por isso são as mais comuns na prática do eletromagnetismo. Pulsos de correntes são também usados habitualmente. Se a corrente no transmissor é senoidal, os campos eletromagnéticos também serão do tipo senoidal. Neste caso, se trabalha no domínio da freqüência. Se a excitação no transmissor for do tipo pulso de corrente, então se trabalha no domínio do tempo. A passagem do domínio do tempo para o domínio da freqüência se dá por meio das transformadas de Fourier. Por ser o regime senoidal mais simples, é mais fácil resolver um problema de eletromagnetismo no domínio da freqüência do que no domínio do tempo. Uma vez tendo a solução no domínio da freqüência, obtém-se a solução no domínio do tempo por meio da transformada inversa de Fourier, qualquer que seja o tipo de pulso de corrente. Com essas observações, não resta outra coisa a fazer a não ser converter as equações (4.83 - 4.86) para o domínio da freqüência. Efetuando a transformada de Fourier dessas equações e lembrando-se que a transformada de Fourier da derivada de uma função, no tempo, é equivalente a multiplicar a transformada por iω, podemos escrever ∇· E = b ρf ,
∇ × H− (σ + iω ) E = Jtx , ∇ · μH = 0,
∇ × E − iωμH = 0,
(4.91) (4.92) (4.93) (4.94)
em que o acento circunflexo e as letras em negrito representam a transformada da função. Por exemplo, E (ω) é a transformada de Fourier de E (t)36 . Analogamente, na fronteira de dois meios as equações (4.87 - 4.90) se convertem em, n ˆ · ( 2 E2 −
1 E1 )
= b ρs ,
n ˆ × (H2 − H1 ) = Js ,
n ˆ · (μ2 E2 − μ1 E2 ) = 0,
n ˆ × (E2 − E1 ) = 0.
(4.95) (4.96) (4.97) (4.98)
As equações (4.91 - 4.94) e (4.95 -4.98) constituem a última versão das equações de Maxwell apresentadas de modo axiomático no primeiro capítulo. 36 A rigor E(w) e E(t) deveriam ter sido escritos assim, E(x, y, z, w) e E(x, y, z, t), entretanto, por serem campos vetoriais já está implícita a dependência espacial.
4.13. SUMÁRIO
375
Estas equações são o ponto de partida para inúmeros problemas de eletromagnetismo que serão analisados até o final do livro. Elas são, também, o ponto de partida da teoria dos métodos eletromagnéticos geofísicos.
4.13
Sumário
Na segunda metade do século XIX foram propostas várias teorias para explicar numa única abordagem os fenômenos elétricos, magnéticos e óticos, até então conhecidos. Entre todas elas, a de Maxwell é a mais popular por sua simplicidade e versatilidade, tanto do ponto de vista teórico como prático. Inicialmente, Maxwell propôs vinte equações que posteriormente, após a sua morte aos 48 anos, foram reescritas por Heaviside em oito equações que deram origem as quatro equações vetoriais universalmente conhecidas como equações de Maxwell. Estas equações podem ser representadas tanto na forma integral como diferencial. A forma integral é mais conveniente para visualizar o conteúdo físico das equações. Por outro lado, a representação diferencial é mais vantajosa para se fazer os cálculos Neste primeiro capítulo, fizemos um vôo panorâmico sobre as equações de Maxwell. Nos dois próximos capítulos aterrissaremos para apreciar os detalhes. No vôo panorâmico foram apresentadas cinco versões das equações de Maxwell. A primeira versão tratou apenas dos campos microscópicos E e B, sem levar em consideração nenhuma informação, a priori, sobre as propriedades elétricas e magnéticas dos meios intervenientes. Na segunda versão os meios já se fazem presentes por meio dos campos macroscópicos D e H, embora ainda de modo camuflado. Estas duas versões são absolutamente equivalentes e são demasiadamente gerais para os nossos objetivos. Por isso, na Figura ??, o círculo correspondente a estas duas versões abrange todos os demais círculos ligados às versões mais especializadas. Na última versão, a mais simplificada de todas, as equações de Maxwell também envolve o tempo, porém de maneira bastante especial. O tempo, agora, varia de forma senoidal com uma freqüência fixa, e por isso se diz que as equações estão no domínio da freqüência. O mais interessante de tudo isso é que em muitos casos a solução de um problema no domínio do tempo se reduz a vários problemas simples no domínio da freqüência. Sinceramente, é possível que o leitor, principalmente os iniciantes ao eletromagnetismo, não tenha absorvido completamente todas as nuanças discutidas neste primeiro capítulo. Mas, eu espero que o leitor esteja agora suficientemente motivado para juntos descobrirmos os segredos do eletro-
376CAPÍTULO 4. LEIS DE COULOMB, AMPÈRE, GAUSS E FARADAY magnetismo. Afinal de contas o propósito deste primeiro capítulo é servir de motivação para o desenvolvimento dos dois próximos capítulos. Lá, tenho certeza que tudo ficará transparente, claro como o dia!
4.14
Exercícios
Capítulo 5
Eletrostática e Magnetostática I 5.1
Introdução
A Eletrostática e a magnetostática lidam com fenômenos elétricos e magnéticos invariantes no tempo (ω = 0). Neste caso, as equações de Maxwll (4.91 - 4.94) se desacoplam da seguinte maneira: ∇ · E = ρf
∇×E = 0
(5.1)
e ∇ × H = Jf
∇ · μH = 0
(5.2)
em que ρf e Jf são funções independentes do tempo. O primeiro par (5.1) se aplica à eletrostática. O segundo par (5.2) prende-se à magnetostática. No último capítulo vimos que a identidade ∇ × E = 0. equivale a dizer que o campo elétrico provém de um potencial escalar U , satisfazendo a equação E = −∇U . (5.3) Assim, um problema em eletrostática consiste na determinação do campo escalar U , numa determinada região do R3 sujeito a certas condições de 377
378
CAPÍTULO 5. ELETROSTÁTICA E MAGNETOSTÁTICA I
contorno. Uma vez determinado o campo escalar U , obtém-se o campo elétrico E por intermédio da equação (5.3). A melhor maneira de ver como se resolve um problema de eletrostática é analisar um caso simples, porém típico. Para tanto, consideremos o conjunto de quatro eletrodos planares ilustrado na Figura (5.1a). Os quatro eletrodos são infinitamente longos na direção z. Três eletrodos se encontram aterrados (U = 0). O quarto eletrodo é mantido a um potencial conhecido U0 (0, y). Nas junções entre os quatro eletrodos há uma pequena brecha para isolar os potenciais em cada um deles. Levando-se em conta a simetria do arranjo dos eletrodos e o fato de U0 ser função apenas de y, o problema se resume a duas dimensões. Isto significa que o potencial U (x, y) varia apenas nas direções x > 0 e y.apenas. A Figura (5.1b) representa a idealização matemática.do modelo físico caricaturado na Figura (5.1a).
y
y U4
x
U1
z
U2
U1
a
'
b
U4
b
U3
2
U=0 U2
U3
a
x
(b)
(a)
Figura 5.1: (a) Modelo de quatro eletrodos, dos quais, três estão aterrados e o quarto a um potencial pré-determinado U0 (0, y). (b) Idealização matemática do modelo representado em (a). Suponhamos que o espaço limitado pelos quatro eletrodos esteja preenchido por um material homogêneo que pode ser tanto dielétrico quanto um mal condutor. Um bom condutor não serve porque neste caso o campo elétrico interno seria praticamente zero. Suponhamos que o material limitado pelos eletrodos seja dielétrico. Substituindo a equação (5.3) na segunda equação (5.1), resulta ∇ · ( ∇U ) = ρf (x, y) .
(5.4)
Se, por outro lado, o material limitado pelos eletrodos fosse condutivo,
5.1. INTRODUÇÃO
379
seguiria da equação da continuidade (4.54) que ∇ · J = ic (x, y) , em que iv (x, y) é a densidade volumétrica de corrente contínua. Substituindo (5.3) na lei de Ohm, J = σE, e em seguida fazendo a substituição na equação da continuidade, resulta ∇ · (σ∇U ) = ic (x, y)
(5.5)
Do ponto de vista puramente matemático as equações (5.4) e (5.5) têm o mesmo padrão,1 , ∇ · [k (x, y) ∇U ] = f (x, y) ,
(5.6)
em que k (x.y) representa a propriedade física (permissividade ou condutividade elétrica σ) e f (x, y) representa a fonte (densidade volumétrica de carga ou de corrente, dependendo se o material for dielétrico ou condutor, respectivamente). A solução da equação (5.6) nem sempre é uma tarefa simples, principalmente quando a forma geométrica dos eletrodos for complexa. Por isso, além deste capítulo, o sétimo e o décimo capítulos serão também dedicados a, este mesmo problema. Por que tanto esforço para resolver um problema de eletrostática? A questão é que as técnicas de solução deste problema, supostamente simples, serão empregadas mais adiante na solução de problemas mais interessantes, embora muito mais complexos. Em outras palavras, o problema de eletrostática serve como trampolim para outros muito mais importantes em eletromagnetismo que serão vistos no décimo primeiro e décimo segundo capítulos. A estratégia a ser empregada na solução do problema eletrostático consiste em simplificar ao máximo a equação (5.6) e gradativamente vai-se diminuindo as simplificações até se encontrar uma maneira de resolvê-la na sua forma mais geral possível. Esta estratégia será desenvolvida paulatinamente neste capítulo e nos capítulos sete e nove. A equação (5.6) se simplifica bastante se k 6= 0 for constante, isto é, se o material for homogêneo.Nesse caso, (5.6) se resume à equação de Poisson, ∇2 U = g (x, y) . 1
(5.7)
Esta equação diferencial é conhecida em matemática como uma equação elíptica.
380
CAPÍTULO 5. ELETROSTÁTICA E MAGNETOSTÁTICA I
em que g (x, y) = f (x, y) /k Se a fonte g (x, y) for identicamente nula a equação de Poisson se resume à equação de Laplace (5.8) ∇2 U = 0.
Neste capítulo iniciaremos com a equação de Laplace em coordenadas cartesianas e concluiremos com a equação de Poisson, também em coordenadas cartesianas. Nos capítulos sete e nove trataremos de outros tipos de coordenada (cilíndricas, esféricas ...).
5.2
Equação de Laplace
A formulação matemática do problema dos quatro eletrodos proposto na Introdução (Figura 5.1b) pode ser assim especificada, ∇2 U
= 0,
(5.9)
U (x, 0) = U (x, b) = U (a, y) = 0
(5.10)
U (0, y) = U0 (y) .
(5.11)
Um problema deste tipo é conhecido como Problema de Contorno 2 . Junto com a equação diferencial, são dados, também, os valores de U na fronteira do domínio. Estes valores na fronteira são chamados de condições de fronteira do tipo Dirichlet. Mais adiante serão vistos outros tipos de condições de fronteira. Para simplificar o problema vamos reescrever a função U (x, y) como um produto de duas funções, U (x, y) = X (x) Y (y) , de uma só varíável. Uma função X em relação a x e a outra Y em relaçào a y.3 . Substituindo este produto de funções na equação de Laplace (5.9), vem Y (y) 2
∂ 2 Y (y) ∂ 2 X (x) + X (x) = 0. ∂x2 ∂y2
Tecnicamente, a função U deve ser de classe C 2 (duas vezes continuamente diferenciável) na região aberta (domínio sem a fronteira) e contínua no domínio. 3 Isto pode ser feito porque do ponto de vista matemático este problema é bem posto. Em outras palavras, o problema tem solução e é única. A unicidade da solução garante que qualquer que seja a metodologia usada para solucionar o problema a solução será sempre a mesma. Portanto, esta estratégia de separar as variáveis não particulariza de forma alguma o problema a ser resolvido.
5.2. EQUAÇÃO DE LAPLACE
381
Em seguida, dividindo por X (x) Y (y), resulta 1 ∂ 2 X (x) 1 ∂ 2 Y (y) + = 0. X (x) ∂x2 Y (y) ∂y 2 Como a primeira parcela envolve apenas a variável x e a segunda, apenas a variável y, forçosamente estas parcelas devem ser constantes e simétricas, caso contrário a soma delas não poderia jamais ser zero. Assim,
e
1 d2 X (x) = m2 X (x) dx2
(5.12)
1 d2 Y (y) = −m2 Y (y) dy2
(5.13)
em que m2 é uma constante real4 . Isto posto, a solução da equação de Laplace se resume em resolver estas duas equações diferenciais ordinárias. Iniciando com a segunda equação (5.13), a solução geral5 é Y (y) = A1 sen my + A2 cos my. A condição (5.10) U (x, 0) = 0 implica em Y (0) = 0 e por conseqüência conclui-se que A2 = 0, uma vez que cos my = 1 para y = 0. Continuando, a condição U (x, b) = 0 implica em Y (b) = 0 e por conseqüência conclui-se que mb = nπ,
n = 1, 2, 3 . . . .
(5.14)
Logo,
nπy , n = 1, 2, 3 . . . (5.15) b Vejamos agora a segunda equação (5.12). De (5.14), substituindo m2 por (nπ/b)2 , vem d2 X (x) ³ nπ ´2 − X (x) = 0. dx2 b Y (y) = A1n sen
4
Obviamente, poder-se-ia usar m no lugar de m2 . Este expediente de se usar a constante ao quadrado é para simplificar as expressões algébricas nos resultados finais, eliminando raízes quadradas desnecessárias. 5 Pode ser verificada substituindo na equação.
382
CAPÍTULO 5. ELETROSTÁTICA E MAGNETOSTÁTICA I A solução geral desta equação6 é X (x) = B1n e−
nπx b
+ B2n e
nπx b
.
A condição (5.11), U (a, y) = 0, implica B1n e−
nπa b
+ B2n e
nπa b
=0
e portanto, ³ nπx ´ 2nπa nπx X (x) = B1n e− b − e− b e b ,
n = 1, 2, 3 . . .
(5.16)
De posse das soluções gerais (5.15) e (5.16) das duas equações diferenciais ordinárias (5.12) e (5.13), podemos agora agrupá-las para formar uma família de soluções admissíveis da equação de Laplace. Com efeito, ³ nπx ´ 2nπa nπx nπy Un (x, y) = bn e− b − e− b e b sen , n = 1, 2, 3 . . . (5.17) b
em que a constante bn = A1n B1n . É fácil verificar que cada membro desta família de funções ou uma soma finita delas satisfazem a equação de Laplace. Ademais, cada uma das funções ou uma soma finita delas satisfazem também as condições de fronteiras (5.10) e (5.11). Mas, em contra partida, nenhuma função da família e nem tão pouco uma soma finita delas satisfazem a condição de fronteira (5.11). Entretanto, nossa experiência com as séries de Fourier nos leva a acreditar que uma soma infinita ou seja, uma série contendo essas funções poderia satisfazer a última condição de contorno. De fato, a série U (0, y) = U0 (y) =
³ ´ 2nπa nπy sen bn 1 − e− b b n=1 ∞ X
nada mais é que uma série de Fourier (3.16) em que os coeficientes a0 = an = 0 e ´−1 1 Z b ³ kπy − 2nπa bn = 1 − e b dy (5.18) U0 (y) sin 2b −b b De posse dos coefficientes bn estamos prontos para exibir a solução do problema de cortorno em questão. De fato, de (5.17) podemos escrever, U (x, y) = 6
³ nπx ´ 2nπa nπx nπy bn e− b − e− b e b sen b n=1 ∞ X
Pode ser verificada substituindo na equação.
(5.19)
5.2. EQUAÇÃO DE LAPLACE
383
em que os coeficientes bn são fornecidos por (5.18). Para todos os efeitos, esta é a solução7 do problema de contorno.dos quatro eletrodos da Figura ??. Em princípio, ela é válida para qualquer função U0 (y). Traduzi-la, em números e gráficos, é outra história. No passado, os livros textos se restringiam a casos triviais, puramente acadêmicos. Agora, com o programa Mathematica podemos analisar situações mais interessantes, mais próximas da realidade. A seguir apresentamos um programa simples para calcular a série (5.19), dada a expressão algébrica qualquer da função U0 (y) .
In[1]:= (*--- laplaceEq[expr]:
Calcula a solução da equação de
Laplace em coordenadas cartesianas ---*) laplaceEq[x_,y_,fun_, bn_, a_, b_, nMax_]:= Module[{n}, If[x == 0, fun[y], Sum[If[bn[n] != 0, bn[n] (Exp[-n Pi x/b] - Exp[-2 n Pi a/b] Exp[n Pi x/b])/ (1 - Exp[-2 n Pi a/b]) Sin[n Pi y/b], 0], {n, nMax}]]]
Neste programa usa-se dois contadores, n1 e n2 .O contador n1 se aplica a valores pequenos de x, isto é, próximos de orígem, onde a série converge mais lentamente. O contador n2 ¿ n1 se aplica a valores de x intermediários ou grandes, onde a série converge rapidamente. Os coeficientes de Fourier bn requiridos pelo programa laplaceEq[expr] devem ser calculados previamente com o Mathematica. O póximo programa traça o gráfico do potencial U (x, y).
De posse do potencial U (x, y), o próximo passo é determinar o campo elétrico E (x, y). Isto é muito simples. Basta derivar o potencial com relação 7 Solução formal, simbólica, acadêmica do problema. Para os matemáticos basta. Para os pragmáticos nem tanto!
384
CAPÍTULO 5. ELETROSTÁTICA E MAGNETOSTÁTICA I
às variáveis x e.y.e substituir na fórmula (5.3). Assim, E (x, y) = Ex (x, y) î + Ey (x, y)ˆj ∞ ³ nπx ´ 2nπa nπx nπy πX î = nbn e− b + e− b e b sen b n=1 b −
∞ ³ nπx ´ 2nπa nπx πX nπy ˆj nbn e− b − e− b e b cos b n=1 b
(5.20)
em que os coeficientes de Fourier bn por (5.18).
In[2]:= (*--- componenteEx[expr]:
Calcula a componente Ex do
campo elétrico ---*) componenteEx[x_,y_, bn_, a_, b_, nMax_]:=
Module[{n},
Pi/b Sum[If[bn[n] != 0, n bn[n] (Exp[-n Pi x/b] + Exp[-2 n Pi a/b] Exp[n Pi x/b])/ (1 - Exp[-2 n Pi a/b]) Sin[n Pi y/b], 0], {n, nMax}]]]
In[3]:= (*--- componenteEx[expr]:
Calcula a componente Ey do
campo elétrico ---*) componenteEy[x_,y_, bn_, a_, b_, nMax_]:=
Module[{n},
-Pi/b Sum[If[bn[n] != 0, n bn[n] (Exp[-n Pi x/b] - Exp[-2 n Pi a/b] Exp[n Pi x/b])/ (1 - Exp[-2 n Pi a/b]) Cos[n Pi y/b], 0], {n, nMax}]]]
O programa a seguir usa esta fórmula para calcula o campo elétrico e traça o campo de vetores correspondente In[4]:= (*--- Figura 3.6: plotPotencialU[expr]: potencial U(x,y) ---*) In[4]:= (*--- Ativa o pacote Add On: 0 constante. Em virtude da simplicidade do problema vamos resolvê-lo, primeiro, analiticamente e em seguida, numericamente, por elementos finitos. A solução geral da equação diferencial é √ k
u (x) = C1 ex/
√ k
+ C2 e−x/
¡ ¢ − 32 x2 + 2k − 1 .
Esta solução é facilmente obtida com o Mathematica. Com efito, In[1]:=
Clear[x, k] DSolve[-k D[u[x], {x, 2}] + u[x] == 32 (1 - x^2), u[x], x] Out[2]:=
√
√
{{u[x] -> -32 (-1 + 2 k + x2 ) + ex/ k C[1] + e−x/ k C[2]}}
Para determinar as constantes C1 e C2 vamos aplicar as duas condições de fronteiras. Então, √ √ C1 C2 du (x0 ) = √ ex0 / k − √ e−x0 / k = u0 + 64x0 dx k k
9.6. MÉTODO DOS ELEMENTOS FINITOS 1D
621
e
√ √ du C1 C2 (xL ) = √ exL / k − √ e−xL / k = uL + 64xL dx k k Resolvendo este sistema de duas equações, é fácil determinar as constantes A e B. Com efeito, √ √ i √ h k (uL + 64xL ) e−x0 / k − (u0 + 64x0 ) e−xL / k √ √ C1 = e(xL −x0 )/ k − e(x0 −xL )/ k
e
C2 =
√ √ i √ h k (uL + 64xL ) ex0 / k − (u0 + 64x0 ) exL / k √
√
e(xL −x0 )/ k − e(x0 −xL )/ k Esta solução exata é facilmente programada em linguagem Mathematica. Com efeito, In[1]:=
uExata[k_, y_, x0_, xL_, u0_, uL_] := Module[{c1, c2, den}, den = Exp[(xL - x0)/Sqrt[k]] - Exp[(x0 - xL)/Sqrt[k]]; c1 = Sqrt[k] ((uL + 64 xL) Exp[-x0/Sqrt[k]] - (u0 + 64 x0) Exp[-xL/Sqrt[k]])/den; c2 = Sqrt[k] ((uL + 64 xL) Exp[x0/Sqrt[k]] - (u0 + 64 x0) Exp[xL/Sqrt[k]])/den; c1 Exp[y/Sqrt[k]] + c2 Exp[-y/Sqrt[k]] - 32 (y^2 + 2 k - 1)]
Conhecida a fórmula da solução exata u (x) é possível obter a fórmula o fluxo −k du(x) dx . Entretanto, é mais fácil usar o Mathematica para fazer este trabalho, principalmente se a expressão de u (x) for muito complicada, como de costume. Tudo se resume numa única linha. De fato, In[2]:=
uFlux[y_] = -k D[uExata[k, y, x0, xL, u0, uL], y];
Até aqui tudo foi feito simbolicamente. Para dar continuidade vamos considerar o domínio [x0 , xL ] igual a [−1/2, 1], k = 9, p (x) = 0, q (x) = 1 e as condições de fronteiras du (−1/2) dx = 1/5 e du (1) /dx = −1/2. Fixados estes valores, vamos calcular uma solução por elementos finitos e comparar graficamente com a solução exata. Para isso vamos subdividir o domínio [−1/2, 1] em 31 elementos uniformemente distribuídos. Assim, In[3]:=
622
CAPÍTULO 9. ELEMENTOS FINITOS x = Table[(i - 1)/20 - 0.5, {i, 31}]; {k, x0, xL, u0, uL} = {9, -1/2, 1., 2., -2.}; funK[y_] := 9 funP[y_] := 0 funQ[y_] := 1 funH[y_] := 32 (1 - y^2) {alfa1, beta1, gama1} = {1., 0, 2}; {alfa2, beta2, gama2} = {1., 0, -2}; Clear[a, b, c, d] elementosFinitos1D[x, funK, funP, funQ, funH, alfa1, beta1, gama1, alfa2, beta2, gama2] uAprox ; % // Short uExata[y_] := -6 y^2 + 20 y + 1 - 3 Sin[3 Pi y/2] - 20 Csch[1] Sinh[y] //
N; uExataList = uExata[k, y, x0, xL, u0, uL] /. y -> x // N ; % // Short Out[13]//Short:=
{-0.303169, -0.206612, , -0.69124, -0.790988} Out[16]//Short:=
{-0.303729, -0.207172, , -0.691789, -0.791537}
Resta calcular a densidade de fluxo numericamente. Para isso, basta substituir na fórmula (9.46) os valores aproximados de u (x) contidos na lista uEF. Portanto, In[17]:=
xM = Drop[(RotateLeft[x] - x), -1]; xC = Drop[(RotateLeft[x] + x)/2, -1]; fluxAprox = -Map[funK, xC] Drop[(RotateLeft[uAprox] - uAprox), -1]/xM;
De posse das soluções e dos fluxos exatos e aproximados é instrutivo compará-los graficamente. Como se vê, o ajuste é excelente tanto para a função (potencial) quanto para o fluxo. In[20]:=
plot1 = Show[{Plot[uExata[k, y, x0, xL, u0, uL], {y, -.5, 1}, PlotRange -> {-1, .4}, TextStyle -> {FontSize -> 7.0}], ListPlot[Transpose[{x, uAprox}], PlotStyle -> PointSize[0.015]]}];
9.6. MÉTODO DOS ELEMENTOS FINITOS 1D
623
plot2 = Show[{Plot[uFlux[y], {y, -.5, 1}, TextStyle -> {FontSize -> 7.0}, PlotRange -> {-20, 20}], ListPlot[Transpose[{xC, fluxAprox}], PlotStyle -> PointSize[0.015]]}]; Show[GraphicsArray[{plot1, plot2}]] 0.4
20
0.2 10 -0.4 - 0.2 -0.2
0.2
0.4
0.6
0.8
1.0
-0.4
-0.4 - 0.2
-0.6
0.2
0.4
0.6
0.8
1.0
-10
-0.8 -1.0
-20
Figura 9.21: Continuando com o mesmo exemplo, mas desta feita considerando também q (x) = 0, o Problema de Neuman, −k
d2 u = h (x) , dx2
x0 < x < xL ,
(9.47)
du (x0 ) = u0 , dx du (xL ) = uL , dx com k > 0 constante e h (x) = 32(1 − x2 ) torna-se surpreendentemente mais sutil. Para começar não há garantia que haja solução e se houver, ela não será única. Uma condição necessária para que haja uma solução, na realidade uma infinidade delas, é que Z xL h (x) dx = ku0 − kuL . (9.48) x0
Isto significa que o fluxo devido à fonte é contrabalançado pelos fluxos que entram e saem pelas duas fronteiras. Fisicamente, isto corresponde à conservação de energia do sistema. A energia que entra, sai.
624
CAPÍTULO 9. ELEMENTOS FINITOS
Uma vez satisfeita a condição(9.48), a escolha de uma das soluções do problema é feita da seguinte maneira. Substitui-se uma das condições de Neuman (digamos, a do lado esquerdo) por uma de Dirichlet homogênea ou não. Em seguida resolve-se o problema.tranqüilamente. Em virtude do vínculo (9.48) se deduz facilmente que a solução obtida satisfaz à condição de Neuman que foi substituída pela de Dirichlet. Por fim, somando-se uma constante arbitrária à esta solução produz uma outra solução Tudo isso que foi dito pode ser traduzido simbolicamente da seguinte maneira. A solução geral da equação diferencial (9.48) é u (x) = C1 x + C2 −
¢ 8x2 ¡ 6 − x2 3k
em que C1 e C2 são constantes arbitrárias. Isto é facilmente comprovado com o Mathematica, In[4]:= Clear[k, x]
DSolve[-k D[u[x], {x, 2}] == 32(1 - x^2), u[x], x] Out[4]:= {{u[x]-> -8
x2 (-6 + x2 )/(3 k) + C[1] + x C[2]}}
Para se determinr as constantes C1 e C2 a estratégia é substituir a primeira condição de Neuman pela de Dirichlet u (x0 ) = C3 , em que C3 é uma constante arbitrária. Feito isto, sugue da solução geral que ¢ 8x2 ¡ u (x0 ) = C1 x0 + C2 − 0 6 − x20 = C3 3k e ¢ du (xL ) 32xL ¡ = C1 − 3 − x2L = uL dx 3k Resolvendo este sistema de duas equações, vem C1 = uL + e
¢ 32xL ¡ 3 − x2L 3k
∙ ¸ ¢ ¢ 32xL ¡ 8x2 ¡ 2 C2 = C3 − uL + 3 − xL x0 + 0 6 − x20 3k 3k
Em princípio, o problema está resolvido. Resta saber se, de fato, a condição de Neuman, que foi substituída pela de Dirichlet, é satisfeita ou
9.6. MÉTODO DOS ELEMENTOS FINITOS 1D
625
não. Se for, o problema que acabamos de resolver é equivalente ao problema de Neuman original. Se não, o problema de Neuman deixa de existir e portanto não faz sentido falar de solução. Derivando a solução no ponto x0 e substituindo o valor de A, segue ¢ ¢ 32x0 ¡ ¢ du (x0 ) 32x0 ¡ 32xL ¡ = C1 − 3 − x20 = uL + 3 − x2L − 3 − x20 dx 3k 3k 3k ¢ ¡ Se os dados k, u0 , u0 e h (x) = 32 1 − x2 satisfizerem (9.48), Z xL ¡ ¢ ¢ 32 ¡ 3 32 1 − x2 dx = ku0 − kuL = 32(xL − x0 ) − xL − x30 3 x0
então se conclui que
du (x0 ) = u0 dx e portanto o problema de Neuman tem uma solução. Caso contrário, não exite solução alguma. Note que esta solução não depende da constante arbitrária C3 . Portanto, podemos afirmar que se há uma solução, existe uma infinidade delas, todas deslocadas verticalmente ao longo do eixo y. In[4]:= uExata[k_, y_, x0_, xL_, u0_, uL_, c3_] := Module[{c1, c2},
c1 = uL + 32 xL (1 - xL^3/3)/k; c2 = c3 - a x0 + 16 x0^2 (1 - x0^2/6)/k ; c1 y + c2 - 16 y^2/k (1 - y^2/6)] In[4]:= x = Table[(i - 1)/20 - .5, {i, 31}];
funK[y_] := 9 funP[y_] := 0 funQ[y_] := 0 funH[y_] := 32(1 - y^2) {alfa1, beta1, gama1} = {1, 0, 2}; {alfa2, beta2, gama2} = {1, 0, -2}; Clear[a, b, c, d] Off[NIntegrate::slwcon] Off[NIntegrate::ncvb] elementosFinitos1D[x, funK, funP, funQ, funH, alfa1, beta1, gama1, alfa2, beta2, gama2, a, b, c, d] uEF = TridiagonalSolve[a, b, c, d]; Atenção: Uma infinidade de soluções. Para obter uma, faça alfa1 = 0,
626
CAPÍTULO 9. ELEMENTOS FINITOS beta1 = 1 e gama1 = uma constante qualquer. In[4]:= x = Table[(i - 1)/20 - 0.5, {i, 31}];
funK[y_] := 9 funP[y_] := 0 funQ[y_] := 0 funH[y_] := 32(1 - y^2) {alfa1, beta1, gama1} = {0, 1, -1}; {alfa2, beta2, gama2} = {1, 0, -2}; Clear[a, b, c, d] Off[NIntegrate::slwcon] Off[NIntegrate::ncvb] elementosFinitos1D[x, funK, funP, funQ, funH, alfa1, beta1, gama1, alfa2, beta2, gama2, a, b, c, d] uEF1 = TridiagonalSolve[a, b, c, d]; In[4]:= {alfa1, beta1, gama1} = {0, 1, 0};
Clear[a, b, c, d] elementosFinitos1D[x, funK, funP, funQ, funH, alfa1, beta1, gama1, alfa2, beta2, gama2, a, b, c, d] uEF2 = TridiagonalSolve[a, b, c, d]; In[4]:= {alfa1, beta1, gama1} = {0, 1, 1};
Clear[a, b, c, d] elementosFinitos1D[x, funK, funP, funQ, funH, alfa1, beta1, gama1, alfa2, beta2, gama2, a, b, c, d] uEF3 = TridiagonalSolve[a, b, c, d]; In[4]:= {alfa1, beta1, gama1} = {0, 1, 2};
Clear[a, b, c, d] elementosFinitos1D[x, funK, funP, funQ, funH, alfa1, beta1, gama1, alfa2, beta2, gama2, a, b, c, d] uEF4 = TridiagonalSolve[a, b, c, d]; In[4]:= {alfa1, beta1, gama1} = {0, 1, 3};
Clear[a, b, c, d] elementosFinitos1D[x, funK, funP, funQ, funH, alfa1, beta1, gama1, alfa2, beta2, gama2, a, b, c, d] uEF5 = TridiagonalSolve[a, b, c, d]; In[4]:=
CD - ROM
Análogo à célula In[4]
9.6. MÉTODO DOS ELEMENTOS FINITOS 1D 4
627
20 15
3
10 2
5
1 -0.4 -0.2 -5 -0.4 -0.2 -1
0.2 0.4 0.6 0.8
1
0.2 0.4 0.6 0.8
1
-10 -15
-2
-20
Figura 9.22: In[4]:= {k, x0, xL, u0, uL} = {9, -.5, 1, 2, -2};
uFlux[y_] = -k D[uExata[k, y, x0, xL, u0, uL, 1], y]; p1 = Show[{Plot[{uExata[k, y, x0, xL, u0, uL, -1], uExata[k, y, x0, xL, u0, uL, 0], uExata[k, y, x0, xL, u0, uL, 1], uExata[k, y, x0, xL, u0, uL, 2], uExata[k, y, x0, xL, u0, uL, 3]}, {y, -.5, 1}, PlotRange -> {-2, 4}, TextStyle -> {FontSize -> 6.0}, DisplayFunction -> Identity], ListPlot[Transpose[{x, uEF1}], PlotStyle -> PointSize[0.01], DisplayFunction -> Identity], ListPlot[Transpose[{x, uEF2}], PlotStyle -> PointSize[0.01], DisplayFunction -> Identity], ListPlot[Transpose[{x, uEF3}], PlotStyle -> PointSize[0.01], DisplayFunction -> Identity], ListPlot[Transpose[{x, uEF4}], PlotStyle -> PointSize[0.01], DisplayFunction -> Identity], ListPlot[Transpose[{x, uEF5}], PlotStyle -> PointSize[0.01], DisplayFunction -> Identity]}]; p2 = Show[{Plot[uFlux[y], {y, -.5, 1}, TextStyle -> {FontSize -> 6.0}, PlotRange -> {-20, 20}, DisplayFunction -> Identity], ListPlot[Transpose[{xC, fluxEF}], PlotStyle -> PointSize[0.01], DisplayFunction -> Identity]}]; Show[GraphicsArray[{p1, p2}], DisplayFunction -> $DisplayFunction]; In[4]:= x = Table[(i - 1)/20 - 0.5, {i, 31}];
628
CAPÍTULO 9. ELEMENTOS FINITOS funK[y_] := 10 funP[y_] := 0 funQ[y_] := 0 funH[y_] := 32(1 - y^2) {alfa1, beta1, gama1} = {1, 0, 2}; {alfa2, beta2, gama2} = {1, 0, -2}; Clear[a, b, c, d] Off[NIntegrate::slwcon] Off[NIntegrate::ncvb] elementosFinitos1D[x, funK, funP, funQ, funH, alfa1, beta1, gama1, alfa2, beta2, gama2, a, b, c, d] uEF1 = TridiagonalSolve[a, b, c, d]; Atenção: Balanço do fluxo = 4. Não há solução. In[4]:= funK[y_] := 9
{alfa1, beta1, gama1} = {1, 0, 3}; Clear[a, b, c, d] elementosFinitos1D[x, funK, funP, funQ, funH, alfa1, beta1, gama1, alfa2, beta2, gama2, a, b, c, d] uEF1 = TridiagonalSolve[a, b, c, d]; Atenção: Balanço do fluxo = -9. Não há solução.
Exemplo 7.3 A partição do intervalo em elementos finitos não precisa ser uniforme como foi feito até agora. Neste exemplo vamos usar uma partição não-uniforme. Seja equação de Airy, () (Seção , pag ), d2 u − xu = 0, dx2
2 < x < 10
sujeita às condições de Dirichlet u (2) = 5 e u (10) = −10. Note que k (x) = 1, p (x) = 0, q (x) = x e h (x) = 0.Vamos comparar graficamente a solução exata com a solução aproximada por elemtos finitos com a seguinte partição: x = {2., 2.01, 2.25, 2.5, 2.75, 3, 3.25, 3.5, 3.75, 4, 5, 6, 7, 8, 8.25, 8.5, 8.75, 9., 9.125, 9.25, 9.375, 9.5, 9.625, 9.75, 9.875, 9.9, 9.99, 10} Note que a equação de Airy é um caso particular de (9.17) em que k (x) = 1, p (x) = 0, q (x) = −x e h (x) = 0. Primeiro, a solução exata. De (), a solução da equação de Airy é u (x) = C1 Ai (x) + C2 Bi (x). em que Ai (x) e Bi (x) são, respectivamente, as funções de Airy de primeira e segunda espécies
9.6. MÉTODO DOS ELEMENTOS FINITOS 1D
629
Aplicando as condições de fronteira, u (x0 ) = C1 Ai (x0 ) + C2 Bi (x0 ) = u0 e u (xL ) = C1 Ai (xL ) + C2 Bi (xL ) = uL Resolvendo este sistema de equações, obtém-se C1 =
u0 Bi (xL ) − uL Bi (x0 ) Ai (x0 )Bi (xL ) − Ai (xL )Bi (x0 )
C1 =
Ai (x0 )uL − Ai (xL )u0 Ai (x0 )Bi (xL ) − Ai (xL )Bi (x0 )
e
In[4]:= uExata[y_, x0_, xL_, u0_, uL_] := Module[{c1, c2, den},
den = AiryAi[x0] AiryBi[xL] - AiryAi[xL] AiryBi[x0]; c1 = (u0 AiryBi[xL] - uL AiryBi[x0])/den; c2 = (AiryAi[x0] uL - AiryAi[xL] u0)/den; c1 AiryAi[y] + c2 AiryBi[y]];
Como sempre, o fluxo é dado por In[4]:= uFlux[y_] = -funK[y] D[uExata[y, x0, xL, u0, uL], y]; In[4]:= x = {2., 2.01, 2.25, 2.5, 2.75, 3, 3.25, 3.5, 3.75, 4, 5, 6, 7, 8, 8.25, 8.5,
8.75, 9., 9.125, 9.25, 9.375, 9.5, 9.625, 9.75, 9.875, 9.9, 9.99, 10}; funK[y_] := 1; funP[y_] := 0; funQ[y_] := y; funH[y_] := 0 ; {alfa1, beta1, gama1} = {0, 1, 5}; {alfa2, beta2, gama2} = {0, 1, -10}; Clear[a, b, c, d] elementosFinitos1D[x, funK, funP, funQ, funH, alfa1, beta1, gama1, alfa2, \
In[4]:=
beta2, gama2, a, b, c, d] uEF = TridiagonalSolve[a, b, c, d]; CD - ROM
Análogo à célula In[4]
630
CAPÍTULO 9. ELEMENTOS FINITOS
4 2 -2 -4 -6
4
6
8
10
35 30 25 20 15 10 5
-8 -10
-5
4
6
8
10
Figura 9.23: In[4]:= p1 = Show[{Plot[uExata[y, 2, 10, 5, -10], {y, 2, 10},
PlotRange -> {-10, 5}, TextStyle -> {FontSize -> 8.0}, DisplayFunction -> Identity], ListPlot[Transpose[{x, uEF}], PlotStyle -> PointSize[0.02], DisplayFunction -> Identity]}]; uFlux[y_] = funK[y] D[uExata[y, 2, 10, 5, -10], y]; p2 = Show[{Plot[uFlux[y], {y, 2, 10}, TextStyle -> {FontSize -> 8.0}, PlotRange -> {5, -35}, DisplayFunction -> Identity], ListPlot[Transpose[{xC, fluxEF}], PlotStyle -> PointSize[0.02], DisplayFunction -> Identity]}]; Show[GraphicsArray[{p1, p2}], DisplayFunction -> $DisplayFunction];
Exemplo 7.3 Em todos os exemplos até aqui analisados, a função k (x) tem sido considerada constante. Entretanto, na prática, a função k (x) raramente é constante, sendo, em muitos casos, uma função contínua ou mesmo contínua por partes. Neste exemplo vamos considerar a função k (x) como sendo contínua. Para tornar o exemplo mais interessante ainda, vamos considerar que as funções p (x) e q (x) sejam funções não nulas. Em outras palavras, pela primeira vez, vamos, de fato, explorar a equação (9.21) na sua totalidade. Dito isto, seja a equação diferencial, d − dx
µ ¶ ¢ du ¡ 2 2x3 2 du x +x − x −4 u=− , dx dx 3π
0 < x0 < x < xL
9.6. MÉTODO DOS ELEMENTOS FINITOS 1D
631
sujeita às condicões de Dirichlet u (x0 ) = u0 e u (xL ) = uL . Note que k (x) = x2 , p (x) = x, q (x) = −x2 + 4 e h (x) = −2x2 / (3π). O objetivo deste exercício é calcular a solução exata e a resposta aproximada com 28 elementos uniformemente distribuídos no intervalo [1, 10] sabendo-se que u0 = −1 e uL = −10. Esta equação diferencial pode ser reescrita da seguinte maneira, ¡ ¢3 ¢ 4 12 x du ¡ 2 2 + x − 2 u = √ ¡5¢, 0 < x < 10 +x dx πΓ 2 ¡ ¢ √ visto que Γ 52 = 3 π/4. De acordo com a equação (??) podemos afirmar que a solução geral desta equação é u (x) = C1 J2 (x) + C2 Y2 (x) + H2 (x) , d2 u x2 2 dx
em que J2 (x) e Y2 (x) são as funções de Bessel e H2 (x) a função de Struve de ordem 2. Aplicando as condições de fronteira u (x0 ) = u0 e u (xL ) = uL , vem C1 J2 (x0 ) + C2 Y2 (x0 ) = u0 − H2 (x0 ) , e C1 J2 (xL ) + C2 Y2 (xL ) = uL − H2 (xL ) . Resolvendo este sistema, obtém-se C1 =
[u0 − H2 (x0 )] Y2 (xL ) − [uL − H2 (xL )] Y2 (x0 ) J2 (x0 ) Y2 (xL ) − J2 (xL ) Y2 (x0 )
C2 =
J2 (x0 ) [uL − H2 (xL )] − J2 (xL ) [u0 − H2 (x0 )] J2 (x0 ) Y2 (xL ) − J2 (xL ) Y2 (x0 )
e
De posse das constantes C1 e C2 pode-se calcular u (x) em qualquer ponto do intervalo [x0 , xL ]. Nos velhos tempos, antes dos computadores, esta era uma tarefa formidável. Agora com os computadores e o Mathematica tudo ficou mais fácil. Assim, In[4]:= uExata[y_, x0_, xL_, u0_, uL_] := Module[{c1, c2},
den = (BesselJ[2, x0] BesselY[2, xL] - BesselJ[2, xL] BesselY[2, x0]); c1 = ((u0 - StruveH[2, x0])BesselY[2, xL] - (uL - StruveH[2, xL])BesselY[2, x0])/den;
632
CAPÍTULO 9. ELEMENTOS FINITOS c2 = (BesselJ[2, x0](uL - StruveH[2, xL]) - BesselJ[2, xL](u0 - StruveH[2,
x0]))/den; c1 BesselJ[2, y] + c2 BesselY[2, y] + StruveH[2, y]]
Como sempre, o fluxo −k (x) du (x) /dx é calculado por In[4]:= uFlux[y_, x0_, xL_, u0_, uL_] = -funK[y] D[uExata[y, x0, xL, u0,
uL], y];
Usando-se uma partição com 28 elementos e os dados do problema, a solução aproximada por elementos finitos e computada com In[4]:= {x0, xL, u0, uL} = {1, 10, -1, -10};
x = 10 Table[(i + 2.)/30, {i, 28}]; funK[y_] := y^2; funP[y_] := y; funQ[y_] := -y^2 + 4; funH[y_] := - 2y^3/(3Pi) ; {alfa1, beta1, gama1} = {0, 1, u0}; {alfa2, beta2, gama2} = {0, 1, uL}; Clear[a, b, c, d] elementosFinitos1D[x, funK, funP, funQ, funH, alfa1, beta1, gama1, alfa2, beta2, gama2, a, b, c, d] uEF = TridiagonalSolve[a, b, c, d];
Como de costume, o fluxo é fornecico com In[4]:=
CD - ROM
Análogo à célula In[4]
Finalmente, o traçado da soluções exata e aproximada é efetuado por meio de, In[4]:= p1 = Show[{Plot[uExata[y, x0, xL, u0, uL], {y, x0, xL},
PlotRange -> {-30, 20}, TextStyle -> {FontSize -> 6.0}, DisplayFunction -> Identity], ListPlot[Transpose[{x, uEF}], PlotStyle -> PointSize[0.015], DisplayFunction -> Identity]}]; p2 = Show[{Plot[uFlux[y, x0, xL, u0, uL], {y, x0, xL}, PlotRange -> {-600, 1000}, TextStyle -> {FontSize -> 6.0}, DisplayFunction -> Identity],
9.6. MÉTODO DOS ELEMENTOS FINITOS 1D 20 10 2
4
6
8
10
633
1000 800 600 400 200
-10 -200 -400 -600
-20 -30
2
4
6
8
10
Figura 9.24: ListPlot[Transpose[{xC, fluxEF}], PlotStyle -> PointSize[0.015], DisplayFunction -> Identity]}]; p3 = Show[GraphicsArray[{p1, p2}], DisplayFunction -> $DisplayFunction];
Exemplo 7.4 Neste último exemplo a função k(x) é do tipo contínua por partes. Estas funções são, de longe, as mais importantes nas aplicações práticas. É aqui que o algoritmo dos elementos finitos mostra todo seu valor e versatilidade, ao contrário de outros métodos que enfrentam grandes dificuldades computacionais no trato deste tipo de funções. Podemos até dizer que deixamos o melhor pora o fim. Seja a equação diferencial d2 u + u = h (x) . x0 < x < xL , dx2 em que a função k (x) é expressa por ⎧ x0 < x < r ⎨ k1 , r PointSize[0.015], DisplayFunction -> Identity]}]; p2 = Show[{Plot[uFlux[y, x0, r, s, xL, k1, k2, k3], {y, 0, 1}, PlotRange -> {-.2, .601}, TextStyle -> {FontSize -> 5.0}, DisplayFunction -> Identity], ListPlot[Transpose[{xC, fluxEF}], PlotStyle -> PointSize[0.015], DisplayFunction -> Identity]}]; Show[GraphicsArray[{p1, p2}], DisplayFunction -> $DisplayFunction];
Exemplo 7.4 Neste último exemplo a função k(x) é do tipo contínua por partes. Estas funções são, de longe, as mais importantes nas aplicações práticas. É aqui que o algoritmo dos elementos finitos mostra todo seu valor e versatilidade, ao contrário de outros métodos que enfrentam grandes dificuldades computacionais no trato deste tipo de funções. Podemos até dizer que deixamos o melhor pora o fim. Seja a equação diferencial d2 u + p2 (z) u = 0. dz 2
0 < z < ∞,
638
CAPÍTULO 9. ELEMENTOS FINITOS
em que a função k (x) é expressa por
p (z) =
⎡
1
1
⎢ e−p1 z1 ep1 z1 ⎢ ⎢ −p1 e−p1 z1 p1 ep1 z1 ⎢ ⎢ 0 0 ⎢ ⎢ 0 0 ⎢ ⎢ .. .. ⎢ . . ⎢ ⎢ 0 0 ⎢ ⎣ 0 0 0 0
⎡
1
1
⎢ ⎢ ⎢ m21 m22 ⎢ ⎢ ⎢ m31 m32 ⎢ ⎢ 0 ⎢ 0 M =⎢ ⎢ 0 0 ⎢ ⎢ . .. ⎢ .. . ⎢ ⎢ ⎢ 0 0 ⎣ 0
0
⎧ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎨
2ir1 , 2ir2 , 2ir3 , 2ir4 ,
⎪ ⎪ 2irj , zj−1 < z < zj ⎪ ⎪ ⎪ ⎪ .. ⎪ ⎪ . ⎪ ⎪ ⎪ ⎪ , z 2ir ⎪ n−1 n−2 < z < zn−1 ⎪ ⎩ 2irn
0
0
e−p2 z1 −p2 e−p2 z1 e−p2 z2 −p2 e−p2 z2 .. .
ep2 z1 p2 ep2 z1 ep2 z2 p2 ep2 z2 .. .
0 0 0
0
0 < z < z1 z1 < z < z2 z2 < z < z3 z3 < z < z4 .. .
0
,
0 0 0
0 0 0
e−p3 z2 −p3 e−p3 z2 .. .
ep3 z2 p3 e−p3 z2 .. .
0 0 epn−1 zn−1 e−pn−1 zn−1 −pn−1 e−pn−1 zn−1 pn−1 epn−1 zn−1
0
0
m23 m24
0
0
m33 m34
0
0
m43 m44 m45 m46 m53 m54 m55 m56 .. .. .. .. . . . . 0
0
0
0
0
0
0
0
0 e−pn zn−1 −pn e−pn zn−1
.. . 0 0 0 .. . 0 0 0 .. . 0 0 0 .. . 0 0 0 .. . 0 0 0 .. .. .. .. . . . . .. . mn−1n−1 mn−1n−1 mn−1n .. . mn−2n mn−1n mnn
⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦
⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦
9.7. MÉTODO DOS ELEMENTOS FINITOS 2D
639
em que m21 = e−p1 z1 , m22 = ep1 z1 , m23 = e−p2 z1 , m24 = ep2 z1 m31 = −p1 e−p1 z1 , m32 = p1 ep1 z1 , m33 = −p2 e−p2 z1 , m34 = p2 ep2 z1 m43 = e−p2 z2 , m44 = ep2 z2 , m45 = e−p3 z2 , m46 = ep3 z2
m53 = −p2 e−p2 z2 , m54 = p2 ep2 z2 , m55 = −p3 e−p3 z2 , m56 = p3 ep3 z2 m65 = e−p3 z3 , m66 = ep3 z3 , m67 = e−p4 z3 , m68 = ep4 z3
m75 = −p3 e−p3z3 , m76 = p3 ep3 z3 , m77 = −p4 e−p4 z3 , m78 = p4 ep4 z3
mjj−1 = e−pj/2 zj/2 , mjj = epj/2 zj/2 , mjj+1 = e−pj/2+1 zj/2 , mjj+2 = epj/2+1 zj/2 mj+1j−1 = −pj/2 e−pj/2 zj/2 , mjj = pj/2 epj/2 zj/2 ,
mjj+1 = −pj/2+1 e−pj/2+1 zj/2 , mjj+2 = pj/2+1 epj/2+1 zj/2
mn−1n−2 = e−pn−1 zn−1 , mn−1n−1 = epn−1 zn−1 , , mn−1n = e−pn zn−1 mnn−2 = −pn−1 e−pn−1 zn−1 , mnn−1 = pn−1 epn−1 zn−1 , mnn = −pn e−pn zn−1
9.7
Método dos Elementos Finitos 2D
O método dos elementos finitos bidimensionais segue paraticamente o mesmo esquema do unidemensional analisado acima. Ssguindo a mesma metodologia, vamos iniciar com o problema piloto formado pela equação bidimensional de Poisson −∇2 u (x, y) = h (x, y)
(9.53)
numa região retangular 0 < x < a, 0 < y < b, com fronteira de Dirichlet homogênea. A solução exata é dada pela série dupla de Fourier u (x, y) =
∞ ∞ sin mπx sin nπy 4 XX Amn ¡ ¢a2 ¡ b¢2 mπ ab + nπ m=1 n=1
a
(9.54)
b
cujos coeficientes Amn são dados por Amn =
Z
0
aZ b 0
¡ ¢ nπy 0 0 0 mπx 0 h x0 , y0 sin sin dx dy a b
(9.55)
Primeiro, vamos traduzir (9.54) e (9.55) na linguagem Mathematica: (*–Calculo dos coeficientes Amn –*) amn[funH_, a_, b_, m_, n_] := Module[{x, y},
640
CAPÍTULO 9. ELEMENTOS FINITOS Simplify[Integrate[ Integrate[funH[x, y] Sin[m Pi x/a], {x, 0, a}] Sin[n Pi y/b], {y, 0, b}], {m, n} \[Element] Integers]]
Agora, vamos calcular a série dupla de Fourier (*–poissonEq2D[expr] calcula a série dupla de Fourier –*) poissonEq2D[amm_, x_, y_, a_, b_, mMax_, nMax_] := Module[{}, Simplify[4./(a b) Sum[Sum[If[amm != 0, amm/((m Pi/a)^2 + (n Pi/b)^2) Sin[m Pi x/a], 0], {m, mMax}] Sin[n Pi y/b], {n, nMax}], {m, n} \[Element] Integers]]
Considerando o retângulo 0 < x < 2 e 0 < b < 2 e h (x, y) = −x2 y , vamos agora usar estes dois programas para determinar a solução da equação de Poisson nos pontos (0.5, 0.5), (0.5, 1.0), (0.75, 0.75), (1.0, 1.0), (1.5, 0.5), (1.5, 1.0) usando 10 termos da série: Clear[m, n] coordXY = {{0.5, 0.5}, {1.5, 0.5}, {1., 1.}, {1.5, 1.}, {0.75, 0.75}, {0.5, 1.5}}; funH[x_, y_] := x^2 y {a, b, mMax, nMax} = {2., 2., 10, 10}; amnC = amn[funH, a, b, m, n] // Simplify; Table[poissonEq2D[amnC, coordXY[[i, 1]], xy[[i, 2]], a, b, mMax, nMax] , {i, Length[coordXY]}] {0.100692, 0.22107, 0.340119, 0.394222, 0.214537, 0.147511}
Com 25 termos teremos da série {a, b, mMax, nMax} = {2., 2., 25, 25}; amnC = amn[funH, a, b, m, n] // Simplify; Table[poissonEq2D[amnC, coordXY[[i, 1]], xy[[i, 2]], a, b, mMax, nMax] , {i, Length[coordXY]}] {0.100967, 0.221526, 0.339415, 0.393563, 0.214442, 0.148187}
Agora visualizar graficamente a solução: Clear[x, y, m, n] {a, b, mMax, nMax} = {2., 2., 5, 5};
9.7. MÉTODO DOS ELEMENTOS FINITOS 2D
641
funH[x_, y_] := x^2 y amnC = amn[funH, a, b, m, n] // Simplify; Plot3D[ poissonEq2D[amnC, x, y, a, b, mMax, nMax], {x, 0, a}, {y, 0, b}, AxesLabel -> {"x", "y", "U"}, BaseStyle -> {FontSize -> 8.}]
Figura 9.26:
Fisicamente, a solução da equação de Poisson corresponde ao potencial gerado pela fonte h (x, y) .Mais importante que o potencial é o seu gradiente, que normalmente corresponde a um o campo elétrico ou magnético. O Mathematica oferece uma maneira simple de visualizar o campo de vetores associado ao gradiente do potencial. ë só usar os comando:
(.4 &), Frame -> True]
642
CAPÍTULO 9. ELEMENTOS FINITOS
2.0
1.5
1.0
0.5
0.0 0.0
0.5
1.0
1.5
2.0
Figura 9.27:
O Mathematica automaticamente interpola a solução da equação para traçar o grafico do potencial. Com o objetivo de preparar o terreno para o estudo dos elementos finitos 2D que veremos logo em breve é conveniente desenvolver uma metodologia de interpolação numa partição triangular da região de interesse do problema. Para iniciar vamos constuir um algoritmo para fazer a numeração dos nós de cada triângulo que forma a malha de interpolação: nosElem[nX_, nY_] := Module[{}, Clear[m, n] nElem = 2*(nX - 1)*(nY - 1); nosE = Table[0, {i, nElem}, {j, 3}]; k = 1; m = 1; Do[n = m; Do[nosE[[k, 1]] = n; nosE[[k, 2]] = n + 1; nosE[[k, 3]] = n + nY + 1; nosE[[k + 1, 1]] = n + nY + 1; nosE[[k + 1, 2]] = n + nY; nosE[[k + 1, 3]] = n; n = n + 1;
9.7. MÉTODO DOS ELEMENTOS FINITOS 2D
643
k = k + 2, {j, nY - 1}]; m = m + nY, {i, nX - 1}] nosE[[2 nY - 3]] = {nY - 1, nY, 2 nY - 1}; nosE[[2 nY - 2]] = {2 nY, 2 nY - 1, nY}; nosE[[2 (nX - 2) (nY - 1) + 1]] = {(nX - 2) nY + 1, (nX - 2) nY + 2, (n - 1) nY + 1}; nosE[[2 (nX - 2) (nY - 1) + 2]] = {(nX - 1) nY + 2, (nX - 1) nY + 1, (nX - 2) nY + 2};]
Em seguida vamos determinar as coordenadas de cada vértice dos triângulos da malha: coordElem[nX_, nY_, a_, b_] := Module[{}, delX = a/(nX - 1); delY = b/(nY - 1); xt = Table[n delX, {n, nX - 1}]; xt = PrependTo[xt, 0]; yt = Table[n delY, {n, nY - 1}]; yt = PrependTo[yt, 0]; coordX = Table[0, {nX nY}]; coordY = Table[0, {nX nY}]; k = 1; Do[Do[ coordX[[k]] = xt[[i]]; coordY[[k]] = yt[[j]]; k = k + 1, {j, nY}], {i, nX}] coordXY = Transpose[{coordX, coordY}]; elemXY = Table[Part[coordXY, nosE[[i]]], {i, Length[nosE]}];]
De posse da numeração dos nós dos trângulos e das coordenadas dos nós é imediato traçar a malha de interpolação. Com efeito, {nX, nY, a, b} = {5, 5, 2., 2.}; nosElem[nX, nY] cordElem[nX, nY, a, b] listXY = Table[Append[elemXY[[j]], elemXY[[j, 1]]], {j, Length[elemXY]}]; ListPlot[listXY, Joined -> True, AspectRatio -> Automatic]
644
CAPÍTULO 9. ELEMENTOS FINITOS 2.0
1.5
1.0
0.5
0.5
1.0
1.5
2.0
Figura 9.28:
Agora vamos calcular o potencial nos nós da malha e traçar o gráfico: {a, b} = {2., 2.}; Clear[x, y, m, n]; funH[x_, y_] := x^2 y; amnC = amn[funH, a, b, m, n] // Simplify ; {nX, nY, maxX, maxY} = {5, 5, 10, 10}; nosElem[nX, nY] cordElem[nX, nY, a, b] Clear[x, y, m, n]; listU = Table[0, {nElem}]; Do[listU[[k]] = Table[{elemXY[[k, j, 1]], elemXY[[k, j, 2]], poissonEq2D[amnC, elemXY[[k, j, 1]], elemXY[[k, j, 2]], a, b, maxX, maxY]}, {j, 3}], {k, nElem}] ListPlot3D[listU, Mesh -> False, AxesLabel -> {"x", "y", "U"}, BaseStyle -> {FontSize -> 8.}]
9.7. MÉTODO DOS ELEMENTOS FINITOS 2D
645
Figura 9.29:
{nX, nY, a, b} = {17, 17, 2., 2.}; nosElem[nX, nY] cordElem[nX, nY, a, b] listXY = Table[Append[elemXY[[j]], elemXY[[j, 1]]], {j, Length[elemXY]}]; ListPlot[listXY, Joined -> True, AspectRatio -> Automatic]
646
CAPÍTULO 9. ELEMENTOS FINITOS 2.0
1.5
1.0
0.5
0.5
1.0
1.5
2.0
Figura 9.30:
{nX, nY, maxX, maxY} = {17, 17, 10, 10}; nosElem[nX, nY] cordElem[nX, nY, a, b] Clear[x, y, m, n]; listU = Table[0, {nElem}]; Do[listU[[k]] = Table[{elemXY[[k, j, 1]], elemXY[[k, j, 2]], poissonEq2D[amnC, elemXY[[k, j, 1]], elemXY[[k, j, 2]], a, b, maxX, maxY]}, {j, 3}], {k, nElem}]
ListPlot3D[listU, Mesh -> False, AxesLabel -> {"x", "y", "U"}, BaseStyle -> {FontSize -> 8.}]
9.7. MÉTODO DOS ELEMENTOS FINITOS 2D
647
Figura 9.31:
Para interpolar linearmente a função u (x, y) em qualquer ponto interno de um triângulo é preciso, em primeiro lugar, se ter as funções bases. Portanto, vamos agora construir as funções bases. Consideremos, então, um elemento genérico Ωe da malha de elementos finitos, ilustrado na Figura 9.32, (x 3, z 3)
3
1 (x 1 , z 1 )
2
(x 2 , z 2)
Figura 9.32: Elemento triangular. e suponhamos que u seja aproximada, no elemento Ωe pela função linear u (x, z) = α + βx + γz,
(9.56)
que corresponde a um plano passando pelos três valores nodais (ue1 , ue2 , ue3 ) de u (x, z) no elemento.
648
CAPÍTULO 9. ELEMENTOS FINITOS
Podemos expressar as três constantes α, β e γ em termos das coordenadas dos nós do triângulo e dos valores nodais ue1 , ue2 , ue3 . Com efeito, ue1 = α + βx1 + γx1 , ue2 = α + βx2 + γx2 , ue3 = α + βx3 + γx3 . Resolvendo este sistema de equações lineares pela regra de Cramer, vem: 1 α= 2∆e em que
¯ e ¯ ¯ ¯ ¯ ¯ ¯ u1 x1 z1 ¯ ¯ 1 ue1 z1 ¯ ¯ 1 x1 ue1 ¯ ¯ e ¯ ¯ ¯ ¯ ¯ 1 1 ¯ u x2 z2 ¯ , α = ¯ 1 ue z2 ¯ , α = ¯ 1 x2 ue ¯ 2 2 ¯ ¯ 2 ¯ ¯ ¯ ¯ e e 2∆ ¯ 2∆ ¯ ¯ ue x3 z3 ¯ 1 ue3 z3 ¯ 1 x3 ue3 ¯ 3 (9.57) ¯ ¯ ¯ 1 x1 z1 ¯ ¯ ¯ 1 ∆e = ¯¯ 1 x2 z2 ¯¯ 2¯ 1 x3 z3 ¯
é a área do triângulo cujos vértices são (xe1 , z1e ), (xe2 , z2e ) e (xe3 , z3e ). Desdobrando os determinantes 9.57, obtemos os valores de α, β e γ. Então, ue1 (x2 x3 − z2 z3 ) + ue2 (x3 x1 − z1 z3 ) + ue3 (x1 x2 − z2 z1 ) , 2∆ ue1 (y2 − y3 ) + ue2 (y3 − y1 ) + ue3 (y1 − y2 ) β = , 2∆ ue1 (y3 − x2 ) + ue2 (x1 − x3 ) + ue3 (x2 − x1 ) γ = 2∆ Re-arranjando os termos dessas expressões, vem α =
ue (x, z) =
a1 + b1 x + c1 z e a2 + b2 x + c2 z e a3 + b3 x + c3 z e u1 + u2 + u3 , 2∆ 2∆ 2∆ (9.58)
em que a1 = x2 z3 − x3 z2 ,
b1 = z2 − z3 ,
c1 = x3 − x2 ,
a3 = x1 z2 − x2 z1 ,
b3 = z1 − z2 ,
c3 = x2 − x1 .
a2 = x3 z1 − x1 z3 ,
b2 = z3 − z1 ,
c2 = x1 − x3 ,
(9.59)
9.7. MÉTODO DOS ELEMENTOS FINITOS 2D
649
Definindo-se as funções bases ϕ1 , ϕ2 e ϕ3 pela expressões: ϕ1 (x, y) = ϕ2 (x, y) = ϕ3 (x, y) =
1 (a1 + b1 x + c1 z) , 2∆ 1 (a2 + b2 x + c2 z) , 2∆ 1 (a3 + b3 x + c3 z) , 2∆
(9.60)
pode-se re-escrever (9.58) da seguinte maneira ue (x, z) = ue1 ϕ1 (x, y) + ue1 ϕ2 (x, y) + ue1 ϕ3 (x, y) .
(9.61)
Veja que as funções bases são lineares e satisfazem as seguintes condições: ϕ1 (x1 , z1 ) = 1, ϕ1 (x2 , z2 ) = 0, ϕ1 (x3 , z3 ) = 0, ϕ2 (x1 , z1 ) = 0, ϕ2 (x2 , z2 ) = 1, ϕ2 (x3 , z3 ) = 0, ϕ3 (x1 , z1 ) = 0, ϕ3 (x2 , z2 ) = 0, ϕ3 (x3 , z3 ) = 1. Estas características das funções bases são ilustradas claramente na figura a seguir: 3
1
1
1
3
1
2
2
2 2
1
3
3
1
1
Figura 9.33: Funções bases lineares de elementos triangulares. De posse das funções base podemos interpolar linearmente qualquer função conhecida numa região triangularizada do plano. E se a função não for conhecida? Ainda podemos interpolar se subermos suficientes informações sobre a função. Em geral essas informações são dadas na forma de uma equação diferencial e de condições de fronteira em torno da região do plano. Neste caso, a interpolação é obtida pelo algoritmo dos elementos finitos.
650
CAPÍTULO 9. ELEMENTOS FINITOS
Seguindo o mesmo caminho do desenvolvimento do algoritmo dos elementos finitos 1D, vamos desenvolver o algoritmo para o caso bidimensional. Vamos empregar o mesmo problema piloto definido no início da seção. Isto é, ∂2u ∂2u − 2 = h (x, y) (9.62) ∂x2 ∂z definida na região 0 < x < 2 e 0 < b < 2, com condições de contorno de Dirichlet homogêneas e h (x, y) = −x2 y. Aplicando o critério de Galerkin em cada elemento, ou seja −
µ
¶ ∂ 2 ue ∂ 2 ue ϕi dxdy = − ϕi + + h (x, y) dxdy = 0, i = 1, 2, 3 ∂x2 ∂z 2 Ωe Ωe (9.63) onde ϕi são as funções base. Usando as seguintes identidades, µ ¶ ∂ϕi ∂u ∂2u ∂u ∂ ϕi − , ϕi 2 = ∂x ∂x ∂x ∂x ∂x µ ¶ ∂2u ∂u ∂ϕi ∂u ∂ ϕi 2 = ϕi − , ∂y ∂y ∂y ∂y ∂y Z
Z
e substituíndo em 9.63 obtemos ¶ ∂ϕi ∂ue ∂ϕi ∂ue + dxdy ∂x ∂x ∂y ∂y Ωe µ ¶ µ ¶¸ Z ∙ ∂ ∂ue ∂ue ∂ ϕi + ϕi dxdy + ∂x ∂x ∂y ∂y e Z Ω = ϕi h (x, y) dxdy Z
µ
Ωe
Aplicando o Teorema de Green Z
∂Ωe
∙
∂ ∂x
µ ¶ µ ¶¸ Z ∂ue ∂ue ∂ue ∂ue ∂ ϕi + ϕi dxdy = − dx − ϕi dy ϕi ∂x ∂y ∂y ∂y ∂x Z∂Ω ∂ue ˆ = − · tdl, ϕi ∂n ∂Ω
na segunda integral do lado esquerdo, resulta
9.7. MÉTODO DOS ELEMENTOS FINITOS 2D
651
µ
¶ Z Z ∂ϕi ∂ue ∂ϕi ∂ue ∂ue ˆ + · tdl, ϕi h (x, y) dxdy + ϕi dxdy = ∂x ∂x ∂y ∂y ∂n Ωe Ωe ∂Ω P e Substituindo ue = uj ϕj nesta expressão obtem-se a matriz e o vetor e fonte do elemento Ω . A matriz do elemento é, Z
3 ∙Z X j=1
Ωe
µ
∂ϕi ∂ϕj ∂ϕi ∂ϕj + ∂x ∂x ∂y ∂y
¶
dxdy
¸
uej
=
Z
Ωe
Z ϕi h (x, y) dxdy+
∂Ω
ϕi
∂ue ˆ ·tdl, ∂n
i = 1, 2, 3, ou simbolicamente,
e e kij ui = hei
i, j = 1, 2, 3
(9.64)
sendo e kij
=
Z
Ωe
µ
∂ϕi ∂ϕj ∂ϕi ∂ϕj + ∂x ∂x ∂y ∂y
¶
dxdy
(9.65)
e o vetor fonte,
hei
=
Z
Ωe
ϕi h (x, y) dxdy +
Z
∂Ω
ϕi
∂ue ˆ · tdl, ∂n
(9.66)
Substituindo as funções base (9.60) em (9.65) e notando que ∂ϕi ∂ϕi = bi , = ci · · · ∂x ∂y podemos explicitar a matriz do elemente na seguinte forma: ⎛ ⎞ b1 b2 + c1 c2 b1 b3 + c1 c3 b21 + c21 ⎟ £ e¤ 1 ⎜ ⎜ b2 b1 + c2 c1 b22 + c22 b2 b3 + c2 c3 ⎟ kij = ⎝ ⎠ e 4∆ 2 2 b3 b1 + c3 c1 b3 b2 + c3 c2 b3 + c3
(9.67)
652
CAPÍTULO 9. ELEMENTOS FINITOS
1 2 5 6 7 13 14 17 21
1 1 k22 1 k12
2 2 k22
2 k12 1 k32
2 k32
5 1 k21 1 k11 3 k12
6
3 + k22
3 k21 3 k11
1 k31 3 k32
3 k31
7
13
2 k21
2 k11
2 k31
14 1 k23 1 k13
28 k11 28 k21 28 k31
1 k33
17 2 k23
2 k13 28 k12 2 + k 28 k33 22 28 k32
21
3 k23 3 k13 28 k13 28 k23 3 + k 28 k33 33
Tabela 9.1: Montagem dos elemetos 1, 2, 3 e 28 na matriz global. Observe que a primeira integral de ( 9.66), do vetor fonte do elemento, pode ser aproximada por Z ϕi (he1 ϕ1 + he2 ϕ2 + he3 ϕ3 ) dxdy Ωe
Agora usando a fórmula Z ϕα1 ϕβ2 ϕγ3 dxdz = 2∆e Ωe
α!β!γ! , (α + β + γ + 2)!
o vetor fonte he é reduzido à seguinte forma: ⎛ 2he1 + he2 + he3 ⎜ e e e ∆e ⎜ ⎜ h1 + 2h2 + h3 he = − 12 ⎜ ⎝ e h1 + he2 + 2he3
⎞ ⎟ ⎟ ⎟ ⎟ ⎠
(9.68)
(9.69)
De posse das matrizes [ke ] e dos vetores he , o próximo passo é construir a matriz global adicionando a contribuição de cada elemento. A Tabela (9.1) ilustra como é feita a montagem dos três primeiros e do último (28) elementos na matriz global correspondente a seguinte malha: (9.1) Cada uma das nove componentes da matriz do elemento é posicionada de acordo com a correlação entre a numeração dos nós do elemento e a nomeração global dos nós na malha conforme a Tabela (9.2)
9.7. MÉTODO DOS ELEMENTOS FINITOS 2D
2 1
5
6
2
3
1
4
27
17
13
2
21
1.5
14
17 28
19
12
7
14
24 25
20
20
12
1
13
19
16
6
23
26
11
11
21
8
18
15
0.5
16 18
8 15
7 22
10
5
9 10
0 4 0
653
9
0.5
1
3 1.5
2
Figura 9.34: Malha de elementos finitos bidimensionais.
Elementos 1 2 3 4 5 .. .
Numeração Local (1, 2, 3) (1, 2, 3) (1, 2, 3) (1, 2, 3) (1, 2, 3) .. .
Numeração global (5, 1, 14) (7, 2, 17) (6, 5, 21) (2, 6, 17) (9, 3, 16) .. .
13 14 15 .. .
(1, 2, 3) (1, 2, 3) (1, 2, 3) .. .
(1, 12, 14) (14, 12, 20) (15, 10, 18) .. .
24 25 26 27 28
(1, (1, (1, (1, (1,
(7, 17, 19) (13, 14, 20) (11, 15, 20) (5, 14, 21) (13, 17, 21)
2, 2, 2, 2, 2,
3) 3) 3) 3) 3)
Tabela 9.2: Correspondência entre as numerações local e global do elemento
Capítulo 10
Elementos Finitos 2D 10.1
Introdução
O método dos elementos finitos bidimensionais segue paraticamente o mesmo esquema do unidemensional analisado acima. Ssguindo a mesma metodologia, vamos iniciar com o problema piloto formado pela equação bidimensional de Poisson −∇2 u (x, y) = h (x, y)
(10.1)
numa região retangular 0 < x < a, 0 < y < b, com fronteira de Dirichlet homogênea. A solução exata é dada pela série dupla de Fourier u (x, y) =
∞ ∞ sin mπx sin nπy 4 XX Amn ¡ ¢a2 ¡ b¢2 mπ ab m=1 n=1 + nπ a
(10.2)
b
cujos coeficientes Amn são dados por Amn =
Z
0
aZ b 0
¡ ¢ nπy 0 0 0 mπx 0 h x0 , y0 sin sin dx dy a b
(10.3)
Primeiro, vamos traduzir (10.2) e (10.3) na linguagem Mathematica: (*–Calculo dos coeficientes Amn –*) amn[funH_, a_, b_, m_, n_] := Module[{x, y}, Simplify[Integrate[ Integrate[funH[x, y] Sin[m Pi x/a], {x, 0, a}] Sin[n Pi y/b], {y, 0, b}], {m, n} \[Element] Integers]]
641
642
CAPÍTULO 10. ELEMENTOS FINITOS 2D Agora, vamos calcular a série dupla de Fourier (*–poissonEq2D[expr] calcula a série dupla de Fourier –*) poissonEq2D[amm_, x_, y_, a_, b_, mMax_, nMax_] := Module[{}, Simplify[4./(a b) Sum[Sum[If[amm != 0, amm/((m Pi/a)^2 + (n Pi/b)^2) Sin[m Pi x/a], 0], {m, mMax}] Sin[n Pi y/b], {n, nMax}], {m, n} \[Element] Integers]]
Considerando o retângulo 0 < x < 2 e 0 < b < 2 e h (x, y) = −x2 y , vamos agora usar estes dois programas para determinar a solução da equação de Poisson nos pontos (0.5, 0.5), (0.5, 1.0), (0.75, 0.75), (1.0, 1.0), (1.5, 0.5), (1.5, 1.0) usando 10 termos da série: Clear[m, n] coordXY = {{0.5, 0.5}, {1.5, 0.5}, {1., 1.}, {1.5, 1.}, {0.75, 0.75}, {0.5, 1.5}}; funH[x_, y_] := x^2 y {a, b, mMax, nMax} = {2., 2., 10, 10}; amnC = amn[funH, a, b, m, n] // Simplify; Table[poissonEq2D[amnC, coordXY[[i, 1]], xy[[i, 2]], a, b, mMax, nMax] , {i, Length[coordXY]}] {0.100692, 0.22107, 0.340119, 0.394222, 0.214537, 0.147511}
Com 25 termos teremos da série {a, b, mMax, nMax} = {2., 2., 25, 25}; amnC = amn[funH, a, b, m, n] // Simplify; Table[poissonEq2D[amnC, coordXY[[i, 1]], xy[[i, 2]], a, b, mMax, nMax] , {i, Length[coordXY]}] {0.100967, 0.221526, 0.339415, 0.393563, 0.214442, 0.148187}
Agora visualizar graficamente a solução: Clear[x, y, m, n] {a, b, mMax, nMax} = {2., 2., 5, 5}; funH[x_, y_] := x^2 y amnC = amn[funH, a, b, m, n] // Simplify; Plot3D[ poissonEq2D[amnC, x, y, a, b, mMax, nMax], {x, 0, a}, {y, 0, b},
10.1. INTRODUÇÃO
643
AxesLabel -> {"x", "y", "U"}, BaseStyle -> {FontSize -> 8.}]
Figura 10.1:
Fisicamente, a solução da equação de Poisson corresponde ao potencial gerado pela fonte h (x, y) .Mais importante que o potencial é o seu gradiente, que normalmente corresponde a um o campo elétrico ou magnético. O Mathematica oferece uma maneira simple de visualizar o campo de vetores associado ao gradiente do potencial. ë só usar os comando:
(.4 &), Frame -> True]
644
CAPÍTULO 10. ELEMENTOS FINITOS 2D
2.0
1.5
1.0
0.5
0.0 0.0
0.5
1.0
1.5
2.0
Figura 10.2:
O Mathematica automaticamente interpola a solução da equação para traçar o grafico do potencial. Com o objetivo de preparar o terreno para o estudo dos elementos finitos 2D que veremos logo em breve é conveniente desenvolver uma metodologia de interpolação numa partição triangular da região de interesse do problema. Para iniciar vamos constuir um algoritmo para fazer a numeração dos nós de cada triângulo que forma a malha de interpolação: nosElem[nX_, nY_] := Module[{}, Clear[m, n] nElem = 2*(nX - 1)*(nY - 1); nosE = Table[0, {i, nElem}, {j, 3}]; k = 1; m = 1; Do[n = m; Do[nosE[[k, 1]] = n; nosE[[k, 2]] = n + 1; nosE[[k, 3]] = n + nY + 1; nosE[[k + 1, 1]] = n + nY + 1; nosE[[k + 1, 2]] = n + nY; nosE[[k + 1, 3]] = n; n = n + 1;
10.1. INTRODUÇÃO
645
k = k + 2, {j, nY - 1}]; m = m + nY, {i, nX - 1}] nosE[[2 nY - 3]] = {nY - 1, nY, 2 nY - 1}; nosE[[2 nY - 2]] = {2 nY, 2 nY - 1, nY}; nosE[[2 (nX - 2) (nY - 1) + 1]] = {(nX - 2) nY + 1, (nX - 2) nY + 2, (n - 1) nY + 1}; nosE[[2 (nX - 2) (nY - 1) + 2]] = {(nX - 1) nY + 2, (nX - 1) nY + 1, (nX - 2) nY + 2};]
Em seguida vamos determinar as coordenadas de cada vértice dos triângulos da malha: coordElem[nX_, nY_, a_, b_] := Module[{}, delX = a/(nX - 1); delY = b/(nY - 1); xt = Table[n delX, {n, nX - 1}]; xt = PrependTo[xt, 0]; yt = Table[n delY, {n, nY - 1}]; yt = PrependTo[yt, 0]; coordX = Table[0, {nX nY}]; coordY = Table[0, {nX nY}]; k = 1; Do[Do[ coordX[[k]] = xt[[i]]; coordY[[k]] = yt[[j]]; k = k + 1, {j, nY}], {i, nX}] coordXY = Transpose[{coordX, coordY}]; elemXY = Table[Part[coordXY, nosE[[i]]], {i, Length[nosE]}];]
De posse da numeração dos nós dos trângulos e das coordenadas dos nós é imediato traçar a malha de interpolação. Com efeito, {nX, nY, a, b} = {5, 5, 2., 2.}; nosElem[nX, nY] cordElem[nX, nY, a, b] listXY = Table[Append[elemXY[[j]], elemXY[[j, 1]]], {j, Length[elemXY]}]; ListPlot[listXY, Joined -> True, AspectRatio -> Automatic]
646
CAPÍTULO 10. ELEMENTOS FINITOS 2D 2.0
1.5
1.0
0.5
0.5
1.0
1.5
2.0
Figura 10.3:
Agora vamos calcular o potencial nos nós da malha e traçar o gráfico: {a, b} = {2., 2.}; Clear[x, y, m, n]; funH[x_, y_] := x^2 y; amnC = amn[funH, a, b, m, n] // Simplify ; {nX, nY, maxX, maxY} = {5, 5, 10, 10}; nosElem[nX, nY] cordElem[nX, nY, a, b] Clear[x, y, m, n]; listU = Table[0, {nElem}]; Do[listU[[k]] = Table[{elemXY[[k, j, 1]], elemXY[[k, j, 2]], poissonEq2D[amnC, elemXY[[k, j, 1]], elemXY[[k, j, 2]], a, b, maxX, maxY]}, {j, 3}], {k, nElem}] ListPlot3D[listU, Mesh -> False, AxesLabel -> {"x", "y", "U"}, BaseStyle -> {FontSize -> 8.}]
10.1. INTRODUÇÃO
647
Figura 10.4:
{nX, nY, a, b} = {17, 17, 2., 2.}; nosElem[nX, nY] cordElem[nX, nY, a, b] listXY = Table[Append[elemXY[[j]], elemXY[[j, 1]]], {j, Length[elemXY]}]; ListPlot[listXY, Joined -> True, AspectRatio -> Automatic]
648
CAPÍTULO 10. ELEMENTOS FINITOS 2D 2.0
1.5
1.0
0.5
0.5
1.0
1.5
2.0
Figura 10.5:
{nX, nY, maxX, maxY} = {17, 17, 10, 10}; nosElem[nX, nY] cordElem[nX, nY, a, b] Clear[x, y, m, n]; listU = Table[0, {nElem}]; Do[listU[[k]] = Table[{elemXY[[k, j, 1]], elemXY[[k, j, 2]], poissonEq2D[amnC, elemXY[[k, j, 1]], elemXY[[k, j, 2]], a, b, maxX, maxY]}, {j, 3}], {k, nElem}]
ListPlot3D[listU, Mesh -> False, AxesLabel -> {"x", "y", "U"}, BaseStyle -> {FontSize -> 8.}]
10.1. INTRODUÇÃO
649
Figura 10.6:
Para interpolar linearmente a função u (x, y) em qualquer ponto interno de um triângulo é preciso, em primeiro lugar, se ter as funções bases. Portanto, vamos agora construir as funções bases. Consideremos, então, um elemento genérico Ωe da malha de elementos finitos, ilustrado na Figura 10.7, (x 3, z 3)
3
1 (x 1 , z 1 )
2
(x 2 , z 2)
Figura 10.7: Elemento triangular. e suponhamos que u seja aproximada, no elemento Ωe pela função linear u (x, z) = α + βx + γz,
(10.4)
que corresponde a um plano passando pelos três valores nodais (ue1 , ue2 , ue3 ) de u (x, z) no elemento.
650
CAPÍTULO 10. ELEMENTOS FINITOS 2D
Podemos expressar as três constantes α, β e γ em termos das coordenadas dos nós do triângulo e dos valores nodais ue1 , ue2 , ue3 . Com efeito, ue1 = α + βx1 + γx1 , ue2 = α + βx2 + γx2 , ue3 = α + βx3 + γx3 . Resolvendo este sistema de equações lineares pela regra de Cramer, vem: 1 α= 2∆e em que
¯ e ¯ ¯ ¯ ¯ ¯ ¯ u1 x1 z1 ¯ ¯ 1 ue1 z1 ¯ ¯ 1 x1 ue1 ¯ ¯ e ¯ ¯ ¯ ¯ ¯ 1 1 ¯ u x2 z2 ¯ , α = ¯ 1 ue z2 ¯ , α = ¯ 1 x2 ue ¯ 2 2 ¯ ¯ 2 ¯ ¯ ¯ ¯ e e 2∆ ¯ 2∆ ¯ ¯ ue x3 z3 ¯ 1 ue3 z3 ¯ 1 x3 ue3 ¯ 3 (10.5) ¯ ¯ ¯ 1 x1 z1 ¯ ¯ ¯ 1 ∆e = ¯¯ 1 x2 z2 ¯¯ 2¯ 1 x3 z3 ¯
é a área do triângulo cujos vértices são (xe1 , z1e ), (xe2 , z2e ) e (xe3 , z3e ). Desdobrando os determinantes 10.5, obtemos os valores de α, β e γ. Então, ue1 (x2 x3 − z2 z3 ) + ue2 (x3 x1 − z1 z3 ) + ue3 (x1 x2 − z2 z1 ) , 2∆ ue1 (y2 − y3 ) + ue2 (y3 − y1 ) + ue3 (y1 − y2 ) β = , 2∆ ue1 (y3 − x2 ) + ue2 (x1 − x3 ) + ue3 (x2 − x1 ) γ = 2∆ Re-arranjando os termos dessas expressões, vem α =
ue (x, z) =
a1 + b1 x + c1 z e a2 + b2 x + c2 z e a3 + b3 x + c3 z e u1 + u2 + u3 , 2∆ 2∆ 2∆ (10.6)
em que a1 = x2 z3 − x3 z2 ,
b1 = z2 − z3 ,
c1 = x3 − x2 ,
a3 = x1 z2 − x2 z1 ,
b3 = z1 − z2 ,
c3 = x2 − x1 .
a2 = x3 z1 − x1 z3 ,
b2 = z3 − z1 ,
c2 = x1 − x3 ,
(10.7)
10.1. INTRODUÇÃO
651
Definindo-se as funções bases ϕ1 , ϕ2 e ϕ3 pela expressões: ϕ1 (x, y) = ϕ2 (x, y) = ϕ3 (x, y) =
1 (a1 + b1 x + c1 z) , 2∆ 1 (a2 + b2 x + c2 z) , 2∆ 1 (a3 + b3 x + c3 z) , 2∆
(10.8)
pode-se re-escrever (10.6) da seguinte maneira ue (x, z) = ue1 ϕ1 (x, y) + ue1 ϕ2 (x, y) + ue1 ϕ3 (x, y) .
(10.9)
Veja que as funções bases são lineares e satisfazem as seguintes condições: ϕ1 (x1 , z1 ) = 1, ϕ1 (x2 , z2 ) = 0, ϕ1 (x3 , z3 ) = 0, ϕ2 (x1 , z1 ) = 0, ϕ2 (x2 , z2 ) = 1, ϕ2 (x3 , z3 ) = 0, ϕ3 (x1 , z1 ) = 0, ϕ3 (x2 , z2 ) = 0, ϕ3 (x3 , z3 ) = 1. Estas características das funções bases são ilustradas claramente na figura a seguir: 3
1
@1
3 2
1 @2 2
1
1 3
@3
2
1
1
Figura 10.8: Funções bases lineares de elementos triangulares. De posse das funções base podemos interpolar linearmente qualquer função conhecida numa região triangularizada do plano. E se a função não for conhecida? Ainda podemos interpolar se subermos suficientes informações sobre a função. Em geral essas informações são dadas na forma de uma equação diferencial e de condições de fronteira em torno da região do plano. Neste caso, a interpolação é obtida pelo algoritmo dos elementos finitos.
652
CAPÍTULO 10. ELEMENTOS FINITOS 2D
Seguindo o mesmo caminho do desenvolvimento do algoritmo dos elementos finitos 1D, vamos desenvolver o algoritmo para o caso bidimensional. Vamos empregar o mesmo problema piloto definido no início da seção. Isto é, ∂ − ∂x
µ ¶ µ ¶ ∂u ∂ ∂u k(x, y) − k(x, y) + q(x, y)u = h (x, y) ∂x ∂y ∂y
(10.10)
definida na região 0 < x < 2 e 0 < b < 2, com condições de contorno de Dirichlet homogêneas e h (x, y) = −x2 y, sendo k(x, y) = 1 e q (x, y) = 0. Aplicando o critério de Galerkin em cada elemento, ou seja µ ¶ µ ¶ µ ∂ue ∂ ∂ue ∂ k(x, y) − k(x, y) ϕi dxdy = ϕi − ∂x ∂x ∂y ∂y Ωe Ωe
Z
Z
+ q (x, y) ue dxdy − h (x, y)) dxdy = 0 onde ϕi (i = 1, 2, 3) são as funções base. Usando as seguintes identidades, µ ¶ µ ¶ ∂u ∂ ∂ϕ ∂u ∂ ∂u k = ϕi k −k i , ϕi ∂x ∂x ∂x ∂x ∂x ∂x µ ¶ µ ¶ ∂u ∂ ∂ϕ ∂u ∂ ∂u ϕi k = ϕi k −k i , ∂y ∂y ∂y ∂y ∂y ∂y e substituíndo em ?? obtemos ¶ ∂ϕi ∂ue ∂ϕi ∂ue + dxdy ki ∂x ∂x ∂y ∂y µ ¶ µ ¶¸ Z ∙ ∂ ∂ue ∂ue ∂ + ϕi + ϕi dxdy ∂x ∂y ∂y Ωe ∂x ¶ µ Z ∂ϕi ∂ue ∂ϕi ∂ue +ki + dxdy ∂x ∂x ∂y ∂y Ωe Z +qi ϕi ue dxdy e Ω Z ϕi h (x, y) dxdy = µ
Ωe
Aplicando o Teorema de Green
10.1. INTRODUÇÃO
Z
∂Ωe
∙
∂ ∂x
653
µ ¶ µ ¶¸ Z ∂ ∂ue ∂ue ∂ue ∂ue ϕi + ϕi dxdy = − dx − ϕi dy ϕi ∂x ∂y ∂y ∂y ∂x Z∂Ω ∂ue ˆ · tdl, ϕi = − ∂n ∂Ω
na segunda integral do lado esquerdo, resulta Z
Ωe
µ
∂ϕi ∂ue ∂ϕi ∂ue + ∂x ∂x ∂y ∂y
¶
dxdy =
Z
Ωe
ϕi h (x, y) dxdy +
Z
∂Ω
ϕi
∂ue ˆ · tdl, ∂n
P e Substituindo ue = uj ϕj nesta expressão obtem-se a matriz e o vetor e fonte do elemento Ω . A matriz do elemento é, 3 ∙ Z X ki
µ
j=1
Ωe
Ωe
j=1
3 ∙ Z X + qi
=
Z
Ωe
∂ϕi ∂ϕj ∂ϕi ∂ϕj + ∂x ∂x ∂y ∂y ¸
¶
¸ dxdy uei
ϕi ϕj dxdy uei
ϕi h (x, y) dxdy +
Z
∂Ω
ϕi
∂ue ˆ · tdl, ∂n
i = 1, 2, 3, ou simbolicamente, ¡ e ¢ e e kij + qij ui = hei
i, j = 1, 2, 3
(10.11)
sendo e kij
= ki
Z
µ
∂ϕi ∂ϕj ∂ϕi ∂ϕj + ∂x ∂x ∂y ∂y Ωe Z e = qi ϕi ϕj dxdy qij Ωe
e o vetor fonte,
¶
dxdy
(10.12) (10.13)
654
CAPÍTULO 10. ELEMENTOS FINITOS 2D
hei
=
Z
Ωe
ϕi h (x, y) dxdy +
Z
∂Ω
ϕi
∂ue ˆ · tdl, ∂n
(10.14)
Substituindo as funções base (10.8) em (10.12) e notando que ∂ϕi ∂ϕi = bi , = ci · · · ∂x ∂y e do elemente na seguinte forma: podemos explicitar a matriz kij ⎛ ⎞ b21 + c21 b1 b2 + c1 c2 b1 b3 + c1 c3 ⎟ £ e¤ ke ⎜ ⎜ b2 b1 + c2 c1 b22 + c22 b2 b3 + c2 c3 ⎟ kij = ⎝ ⎠ e 4∆ 2 2 b3 b1 + c3 c1 b3 b2 + c3 c2 b3 + c3
(10.15)
Usando a fórmula Z
Ωe
ϕα1 ϕβ2 ϕγ3 dxdz = 2∆e
α!β!γ! , (α + β + γ + 2)!
(10.16)
e toma a forma a matriz qij
⎛
2 1 1
⎞
⎟ £ e ¤ q e ∆e ⎜ ⎜ i 2 1 ⎟ qij = ⎠ ⎝ 12 1 1 2
(10.17)
Observe que a primeira integral de ( 10.14), do vetor fonte do elemento, pode ser aproximada por Z
Ωe
ϕi (he1 ϕ1 + he2 ϕ2 + he3 ϕ3 ) dxdy
Aplicando a fórmula ( 10.16) Z
Ωe
ϕα1 ϕβ2 ϕγ3 dxdz = 2∆e
α!β!γ! , (α + β + γ + 2)!
o vetor fonte he é reduzido à seguinte forma:
(10.18)
10.1. INTRODUÇÃO
655
∆e h =− 12 e
⎛
2he1 + he2 + he3
⎜ ⎜ he + 2he + he 2 3 ⎜ 1 ⎜ ⎝ e h1 + he2 + 2he3
⎞ ⎟ ⎟ ⎟ ⎟ ⎠
(10.19)
De posse das matrizes [ke ] e dos vetores he , o próximo passo é construir a matriz global adicionando a contribuição de cada elemento. A Tabela (10.1) ilustra como é feita a montagem dos três primeiros e do último (28) elementos na matriz global correspondente a seguinte malha: 1 2.0
5
6
2
3 1
4 27
17
21
2
13 14
1.5
17 19
12
28
7
14
24 25
1.0
20
20
12
13
19
16
23 11
26
11
6
15
0.5
8
18
21
16 18
8 15
7 22
10
5 9
4
10 0.5
3
9 1.0
1.5
2.0
Figura 10.9: (10.1) Cada uma das nove componentes da matriz do elemento é posicionada de acordo com a correlação entre a numeração dos nós do elemento e a nomeração global dos nós na malha conforme a Tabela (10.2) A Figura abaixo mostra o perfil da matriz global. Observe que a matriz é simétrica e esparsa. Estas são propriedades importantes da matriz global. A seguir apresentamos o código em Mathematica para o cálculo das matrizes dos elementos e a construção da matriz global.
656
CAPÍTULO 10. ELEMENTOS FINITOS 2D
1 2 5 6 7 13 14 17 21
1 1 k22 1 k12
2 2 k22
2 k12 1 k32
2 k32
5 1 k21 1 k11 3 k12
6
3 + k22
7
3 k21 3 k11
1 k31 3 k32
3 k31
13
2 k21
2 k11
2 k31
14 1 k23 1 k13
28 k11 28 k21 28 k31
1 k33
17 2 k23
2 k13 28 k12 2 + k 28 k33 22 28 k32
21
3 k23 3 k13 28 k13 28 k23 3 + k 28 k33 33
Tabela 10.1: Montagem dos elemetos 1, 2, 3 e 28 na matriz global.
Elementos 1 2 3 4 5 .. .
Numeração Local (1, 2, 3) (1, 2, 3) (1, 2, 3) (1, 2, 3) (1, 2, 3) .. .
Numeração global (5, 1, 14) (7, 2, 17) (6, 5, 21) (2, 6, 17) (9, 3, 16) .. .
13 14 15 .. .
(1, 2, 3) (1, 2, 3) (1, 2, 3) .. .
(1, 12, 14) (14, 12, 20) (15, 10, 18) .. .
24 25 26 27 28
(1, (1, (1, (1, (1,
(7, 17, 19) (13, 14, 20) (11, 15, 20) (5, 14, 21) (13, 17, 21)
2, 2, 2, 2, 2,
3) 3) 3) 3) 3)
Tabela 10.2: Correspondência entre as numerações local e global do elemento
10.1. INTRODUÇÃO 1
657 5
10
15
21
1
1
5
5
10
10
15
15
21
21 1
5
10
15
21
Figura 10.10: matG = SparseArray[Flatten[Table[ {{nosE[[k, 1]], nosE[[k, 1]]} -> 0., {nosE[[k, 1]], nosE[[k, 2]]} -> 0., {nosE[[k, 1]], nosE[[k, 3]]} -> 0., {nosE[[k, 2]], nosE[[k, 1]]} -> 0., {nosE[[k, 2]], nosE[[k, 2]]} -> 0., {nosE[[k, 2]], nosE[[k, 3]]} -> 0., {nosE[[k, 3]], nosE[[k, 1]]} -> 0., {nosE[[k, 3]], nosE[[k, 2]]} -> 0., {nosE[[k, 3]], nosE[[k, 3]]} -> 0.}, {k, nE}]]]; mat211 = {{2., 1., 1.}, {1., 2., 1.}, {1., 1., 2.}}; Do[ bi = elemXY[[k, 2, 2]] - elemXY[[k, 3, 2]]; bj = elemXY[[k, 3, 2]] - elemXY[[k, 1, 2]]; bk = elemXY[[k, 1, 2]] - elemXY[[k, 2, 2]]; ci = elemXY[[k, 3, 1]] - elemXY[[k, 2, 1]]; cj = elemXY[[k, 1, 1]] - elemXY[[k, 3, 1]]; ck = elemXY[[k, 2, 1]] - elemXY[[k, 1, 1]]; areaE = Det[{{1, elemXY[[k, 1, 1]], elemXY[[k, 1, 2]]}, {1, elemXY[[k, 2, 1]],
658
CAPÍTULO 10. ELEMENTOS FINITOS 2D elemXY[[k, 2, 2]]}, {1, elemXY[[k, 3, 1]], elemXY[[k, 3, 2]]}}]/2.; matE = {{bi*bi + ci*ci, bi*bj + ci*cj, bi*bk + ci*ck}, {bj*bi + cj*ci, bj*bj + cj*cj, bj*bk + cj*ck}, {bk*bi + ck*ci, bk*bj + ck*cj, bk*bk + ck*ck}} ; matE = listfunK[[k]]*matE/(4.*areaE) + listfunQ[[k]]*mat211*areaE/12.; Do[ii = nosE[[k, i]]; Do[ jj = nosE[[k, j]]; matG[[ii, jj]] = matG[[ii, jj]] + matE[[i, j]] , {j, 3}], {i, 3}], {k, nE}];
Do mesmo mode, o código do vetor fonte global é dado por: vecE = {0, 0, 0}; vecG = Table[0, {i, nNos}]; Do[areaE = Det[{{1, elemXY[[k, 1, 1]], elemXY[[k, 1, 2]]}, {1, elemXY[[k, 2, 1]], elemXY[[k, 2, 2]]}, {1, elemXY[[k, 3, 1]], elemXY[[k, 3, 2]]}}]/2.; vecE[[1]] = 2*hi[[1]] + hi[[2]] + hi[[3]]; vecE[[2]] = hi[[1]] + 2*hi[[2]] + hi[[3]]; vecE[[3]] = hi[[1]] + hi[[2]] + 2*hi[[3]]; vecE =(areaE/12.)*vecE; Do[ii = nosE[[k, i]]; vecG[[ii]] = vecG[[ii]] + vecE[[i]], {i, 3}], {k, nE}]