Como entender derivadas: as regras do Produto, da Potência e da Cadeia

A mistura confusa de regras pra tirar derivadas nunca fez sentido de verdade pra mim. A regra da adição, do produto, do quociente – como elas se encaixam? Aliás, o que nós estamos tentando fazer?

Isso é o que penso sobre derivadas:

  • Temos um sistema para analisar, nossa função f
  • A derivada f’, (também conhecida como df/dx) é o comportamento de momento-a-momento
  • Acontece que f é uma parte de um sistema maior (h = f + g)
  • Usando o comportamento das partes, podemos descobrir o comportamento do todo?

Sim. Toda parte tem um “ponto de vista” sobre quanta mudança ela adicionou. Você combina cada ponto de vista para descobrir o comportamento geral.
Cada regra de derivação é um exemplo de como juntar vários pontos de vista.

E por que nós não analisamos o sistema inteiro de uma vez só? É a mesma razão pela qual você não come um hamburguer em uma mordida só: partes menores são mais fáceis de assimilar.

Ao invés de memorizar regras separadas, vejamos como elas se encaixam:

Blog-14

Funções: Qualquer coisa menos gráficos

A explicação padrão do cálculo escreve “f(x) = x²″ e enfia um gráfico na sua cara. Isso realmente ajuda a nossa intuição?

Não pra mim. Gráficos espremem a entrada e saída em uma curva única, e escondem a maquinaria que transforma um no outro. Mas as regras de derivadas são sobre a maquinaria, então vamos vê-la!

Eu visualizo uma função como o processo “entrada(x) => f => saída(y)”.

simple function

Não sou só eu. Cheque este incrível computador mecânico.

A máquina computa funções como adição e multiplicação com mecanismos – você pode ver a mecânica se desdobrando!

simple function

Pense na função f como uma máquina com uma alavanca de entrada “x” e uma alavanca de saída “y”. A medida que ajustamos x, f define a altura de y. Outra analogia: x é o sinal de entrada, f o recebe, faz uma mágica e retorna o sinal y. Use qualquer analogia que te ajude a entender.

Mexendo e remexendo

A derivada é o comportamento “momento-a-momento” da função. O que isso significa? (E não murmure “a derivada é a inclinação” sem pensar antes. Você tá vendo algum gráfico por aqui, colega?)

A derivada é quanto se mexe. A alavanca está em x, nós “mexemos” nela e vemos em quanto y se altera. “Oh, nós movemos a alavanca de entrada em 1mm, e a de saída se moveu 5mm. Interessante.”

O resultado pode ser escrito como “variação na saída por variação na entrada”  ou “dy/dx” (5mm/1mm = 5, no nosso caso). Isso é normalmente uma fórmula, não um valor estático, porque pode depender da sua configuração de entrada atual.

Por exemplo, quando temos f(x) = x², a derivada é 2x. Sim, você já decorou isso. E o que significa?

Se nossa alavanca de entrada está em x = 10 e nós mexemos um pouquinho nela (movendo por dx=0.1 para 10.1), a saída deverá mudar por dy. Quanto, exatamente?

  • Sabemos que f’(x) = dy/dx = 2*x
  • Em x = 10 a “variação na saída por variação na entrada” é = 2*10 = 20. A saída move em 20 unidades para cada unidade de movimento de entrada.
  • Se dx = 0.1, então dy = 20*dx = 20*0.1 = 2

E, de fato, a diferença entre 10² e (10.1)² é por volta de 2. A derivada estimou pra quão longe a alavanca de saída se moveria (uma alteração perfeita e infinitamente pequena moveria 2 unidades; nós movemos 2.01)

A chave para entender as regras de derivação:

  • Configure seu sistema
  • Mexa cada parte do sistema separadamente, veja em quanto a saída se move
  • Combine os resultados

A alteração total é a soma das alterações de cada parte.

Adição e Subtração

Chegou a hora de fazer nosso primeiro sistema:

\displaystyle{h(x) = f(x) + g(x) }

derivative addition

O que acontece quando a entrada (x) muda?

Na minha cabeça, eu penso: “A função h recebe uma única entrada. Ela envia a mesma entrada para f e g e adiciona as alavancas de saída. f e g variam independentemente e uma nem sabe sobre a outra!”

A função f sabe que vai contribuir alguma variação (df), g sabe que vai contribuir alguma variação (dg) e nós, ávidos observadores que somos, sabemos que seus comportamentos momento-a-momento são adicionados:

\displaystyle{dh = df + dg}derivative addition

Vamos descrever cada “ponto de vista” denovo:

  • O sistema geral tem comportamento dh
  • Da perspectiva de f, ele contribui df para o todo [f não sabe sobre g]
  • Da perspectiva de g, ele contribui dg para o todo [g não sabe sobre f]

Toda mudança em um sistema se deve a alguma parte mudando (f e g). Se adicionarmos as contribuições de cada variável possível, nós descrevemos o sistema inteiro.

df vs df/dx

Algumas vezes usamos df, outras df/dx — o que acontece? (Isso me confundiu por um tempo)

  • df é a noção geral de “quanto f mudou”
  • df/dx é a noção específica de “quanto f mudou, em termos de quanto x mudou”

O “df” genérico nos ajuda a ver o comportamento geral.

Uma analogia: imagine que você está fazendo uma grande viagem e gostaria de medir a eficiência de combustível do seu carro. Você mediria a distância viajada, checaria seu tanque para ver quanto gás você usou e finalmente faria a divisão para computar os “km’s por litro”. Você mediu a distância e a gasolina separadamente – você não precisou entrar no tanque de gasolina pra descobrir a taxa.

No cálculo, às vezes queremos pensar sobre a mudança em si, e não a taxa. Trabalhar ao nível “df” nos dá espaço para pensar sobre como a função se altera em geral. Podemos eventualmente reduzi-la em termos de uma entrada específica.

E nós faremos isso agora. A regra da adição acima pode ser escrita em termos “por dx”, como:

\displaystyle{\frac{dh}{dx} = \frac{df}{dx} + \frac{dg}{dx}}

Multiplicação (Regra do Produto)

Próximo quebra-cabeças: suponha que nosso sistema multiplica as partes “f” e “g”. Como ele se comporta?

\displaystyle{h(x) = f(x) \cdot g(x)}

Hmm, complicado – as partes estão interagindo de forma mais próxima. Mas a estratégia é a mesma: ver como cada parte contribui de seu ponto de vista, e combinar elas:

  • Mudança total em h = contribuição de f (do ponto de vista de f) + contribuição de g (do ponto de vista de g)

Cheque esse diagrama:

derivative product rule

O que está acontecendo?

  • Temos nosso sistema: f e g são multiplicados, resultando em h (área do retângulo)
  • A entrada “x” muda de acordo com dx na distância. f muda por alguma quantidade df (pense em mudança absoluta, não a taxa!). Semelhantemente, g muda de acordo com sua quantidade dg. Porque f e g mudaram, a área do retângulo muda também.
  • Qual é a mudança da área do ponto de vista de f? Bem, f sabe que mudou por df, mas não tem ideia do que aconteceu com g. Da perspectiva do f’s, ele é o único que moveu e vai adicionar um pedaço de área = df * g
  • Similarmente, g não sabe quanto f mudou, mas sabe que ele vai adicionar um pedaço de área “dg * f”

A mudança total no sistema (dh) são os dois pedaços de área:

\displaystyle{dh = f \cdot dg + g \cdot df}

Agora, como em nosso exemplo dos km’s por litro, nós “dividimos por dx” para escrever isso em termos de quanto x mudou:

\displaystyle{\frac{dh}{dx} = f \cdot \frac{dg}{dx} + g \cdot \frac{df}{dx}}

(Nota: dividir por dx? Engenheiros vão consentir, matemáticos vão reprovar. Tecnicamente, df/dx não é uma fração: é a operação inteira de tirar a derivada (com o limite e todo o resto). Mas em termos de infinitesimais e do que é melhor para a intuição, estamos “alterando por dx”)

A chave da regra do produto: adicione duas “lascas”, uma de cada ponto de vista.

Saquei, mas não tem um efeito dos dois mudando simultaneamente (df * dg)?

Sim. No entanto, essa área é um infinitésimo * infinitésimo (um “infinitésimo de 2a ordem”) e indivisível ao nível atual. É um conceito complicado, mas (df*dg)/dx desaparece comparado a derivadas normais como df/dx. Nós variamos f e g independentemente e combinamos os resultados, ignorando o resultado delas movendo juntas.

A Regra da Cadeia não é tão ruim quanto parece

Digamos que g depende f, que depende de x:

\displaystyle{y = g(f(x))}derivative product rule

A regra da cadeia nos deixa “aproximar” em uma função e ver quanto uma alteração inicial (x) pode afetar no resultado final mais além (g).

Interpretação 1: Converter as taxas

Uma interpretação comum é multiplicar as taxas:

\displaystyle{\frac{dg}{dx} = \frac{dg}{df} \cdot \frac{df}{dx}}

x altera f. Isso cria uma taxa de mudança de df/dx, que altera g por dg/df. Então a alteração é:

\displaystyle{\frac{dg}{df} \cdot \frac{df}{dx}}

Isso é semelhante ao método do “Fator Unitário” da química:

\displaystyle{\frac{miles}{second} = \frac{miles}{hour} \cdot \frac{1 \ hour}{60 \ minutes} \cdot \frac{1 \ minute}{60 \ seconds} = \frac{miles}{hour} \cdot \frac{1}{3600}}

Se sua taxa de “km’s por segundo” muda, multiplique pelo fator de conversão para descobrir o novo “km por hora”. O segundo não sabe sobre a hora diretamente — ele vai através da conversão segundo => minuto.

Semelhantemente, g não sabe sobre x diretamente, só f. A função g sabe que deve escalar sua entrada por dg/df para descobrir a saída. A taxa inicial (df/dx) é modificada enquanto sobe na cadeia.

Interpretation 2: Converter as alterações

Prefiro ver a regra da cadeia em termos de “por variação”:

  • x se altera por dx, so
  • f se altera por df, so
  • g se altera por dg

Legal. Mas como eles são relacionados de verdade? Oh, sim, a derivada! (É a variação na saída por variação na entrada):

\displaystyle{df = dx \cdot \frac{df}{dx}}

Lembre-se, a derivada de f (df/dx) é quanto escalar a alteração inicial. E o mesmo acontece com g:

\displaystyle{dg = df \cdot \frac{dg}{df}}

Ele vai escalar qualquer mudança que vier em sua alavanca de entrada (f) por dg/df. Se escrevemos a variação df em termos de dx:

\displaystyle{dg = (dx \cdot \frac{df}{dx}) \cdot \frac{dg}{df}}

Temos uma outra versão da regra da cadeia: dx começa a cadeia, que resulta em algum resultado final dg. Se queremos a alteração final em termos de dx, dividimos ambos os lados por dx:

\displaystyle{\frac{dg}{dx} = \frac{df}{dx} \cdot \frac{dg}{df}}

A regra da cadeia não é só cancelar unidades pelo Fator Unitário – é a propagação da variação, que é ajustada a cada passo.

A regra da cadeia funciona para várias variáveis (a depende de b, que depende de c), só propague a variação a cada passo.

Tente imaginar uma “ampliação” no ponto de vista de diferentes variáveis. Começando por dx e olhando pra cima, você vê a cadeia inteira de transformações necessárias até que o impulso chegue em g.

Regra da Cadeia: hora do exemplo

Digamos que nós temos uma “máquina de fazer quadrados” na frente de uma “máquina de fazer cubos”:

entrada(x) => f:x^2 => g:f^3 => saída(y)

f:x^2 significa que f eleva sua entrada ao quadrado. g:f^3 significa que g eleva sua entrada (o valor de f) ao cubo. Por exemplo:

entrada(2) => f(2) => g(4) => saída(y) = 64

Comece com 2, f eleva ao quadrado (2^2 = 4), e g eleva isso ao cubo (4^3 = 64). É uma máquina de elevar à sexta potência:

\displaystyle{g(f(x)) = (x^2)^3}

E qual a derivada?

\displaystyle{ \frac{dg}{dx} = \frac{dg}{df} \cdot \frac{df}{dx}}

  • f altera sua variação de entrada por df/dx = 2x
  • g altera sua variação de entrada por dg/df = 3f^2

A mudança final é:

\displaystyle{3f^2 \cdot 2x = 3(x^2)^2 \cdot 2x = 3x^4 \cdot 2x = 6x^5}

Regra da Cadeia: Sacadas

Functions treat their inputs like a blob

In the example, g’s derivative (“x^3 = 3x^2″) doesn’t refer to the original “x”, just whatever the input was (foo^3 = 3*foo^2). The input was f, and it treats f as a single value. Later on, we scurry in and rewrite f in terms of x. But g has no involvement with that — it doesn’t care that f can be rewritten in terms of smaller pieces.

Em muitos exemplos, a variável “x” é o “fim da linha”.

Questions ask for df/dx, i.e. “Give me changes from x’s point of view”. Now, x could depend on something deeper variable, but that’s not being asked for. It’s like saying “I want miles per hour. I don’t care about miles per minute or miles per second. Just give me miles per hour”. df/dx means “stop looking at inputs once you get to x”.

How come we multiply derivatives with the chain rule, but add them for the others?

The regular rules are about combining points of view to get an overall picture. What change does f see? What change does g see? Add them up for the total.

The chain rule is about going deeper into a single part (like f) and seeing if it’s controlled by another variable. It’s like looking inside a clock and saying “Hey, the minute hand is controlled by the second hand!”. We’re staying inside the same part.

Sure, eventually this “per-second” perspective of f could be added to some perspective from g. Great. But the chain rule is about diving deeper into “f’s” root causes.

Regra da Potência: Muito memorizada, pouco entendida

Qual a derivada de x^4? 4x^3? Ótimo. Você trouxe o expoente pra baixo e subtraiu um. Agora explique por quê!

Hrm. Existem algumas abordagens, mas essa é a minha preferida: x^4 na verdade é x * x * x * x. É a multiplicação de 4 variáveis “independentes”. Cada x não sabe sobre os outros, poderia igualmente ser x * u * v * w.

Agora pense sobre o ponto de vista do primeiro x:

  • Ele se altera de x para x + dx
  • A mudança na função geral é [(x + dx) – x][u * v * w] = dx[u * v * w]
  • A mudança em termos “por dx” é [u * v * w]

Semelhantemente,

  • Do ponto de vista de u, ele se altera por du. Ele contribui (du/dx)*[x * v * w] em termos “por dx”
  • v contribui (dv/dx) * [x * u * w]
  • w contribui (dw/dx) * [x * u * v]

As cortinas se abrem: x, u, v, e w são o mesmo! O fator de conversão dos “pontos de vista” é 1 (du/dx = dv/dx = dw/dx = dx/dx = 1), e a mudança total é:

\displaystyle{(x \cdot x \cdot x) + (x \cdot x \cdot x) + (x \cdot x \cdot x) + (x \cdot x \cdot x) = 4 x^3}

Em uma frase: a derivada de x^4 é 4x^3 porque x^4 tem quatro “pontos de vista” idênticos que estão sendo combinados. Agora sim!

Retome o fôlego

Espero que você esteja vendo a derivada sob uma nova ótica: nós temos um sistema de partes, mexemos na nossa entrada e vemos como a coisa toda se move. Tem a ver com combinar perspectivas: o que cada parte adiciona no todo?

Nos próximos artigos, olharemos regras ainda mais poderosas (expoentes, quocientes e amigos). Matemática feliz.

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s