Tässä kirjoituksessa tarkastellaan kahta eri tapaa hahmottaa derivaatta. Formalisoimalla nämä ajatukset saadaan myös kaksi näennäisen erilaista määritelmää derivoituvuudelle. Reaalimuuttujan reaaliarvoiselle funktiolle kyseiset määritelmät ovat yhtäpitäviä, mutta vektorimuuttujan vektoriarvoisille funktioille eivät.
Intuitio 1: derivaattaa muutosnopeuden mittana
Ensimmäinen tapa ajatella derivaattaa on ehkä helpointa selittää esimerkillä fysiikasta. Oletetaan, että kappale liikkuu yhdessä ulottuvuudessa suoraa pitkin (esimerkiksi juna raiteilla). Valitaan suoralta kaksi pistettä ja merkitään niitä ja . Tässä siis on origo ja määrää mittayksikön sekä positiivisen suunnan. Tällöin kappaleen paikkaa ajanhetkenä voidaan kuvata yhdellä reaalilukukoordinaatilla , missä itseisarvo kertoo kuinka monen mittayksikön päässä kappale on origosta ja etumerkki sen kumpaan suuntaan. Fysiikalle ominaiseen tyyliin edellä on tehty yksinkertaistava oletus, että kappale on pistemäinen (esimerkiksi junaa voi edustaa sen painopiste), jolloin sillä on joka hetki yksikäsitteinen paikka. Kutsumme tällaista pistemäistä kappaletta jatkossa partikkeliksi. Partikkelin liikettä ajassa kuvaa funktio . Nyt partikkelin keskinopeus ajanhetkien , välillä määritellään erotusosamääräksi
.
Huomataan, että partikkeli liikkuessa negatiiviseen suuntaan . Kuten paikalla myös nopeudella on sekä suuruus että suunta. Teknisistä syistä keskinopeuden määritelmä kannattaa laajentaa koskemaan myös tapausta .
Tietystikään partikkeli ei välttämättä liiku ajanhetkien ja välillä koko ajan samalla nopeudella, vaan se saattaa välillä liikkua selvästi keskinopeutta kovempaa ja välillä taas paljon hitaammin – ehkä jopa kokonaan vastakkaiseen suuntaan. Mikä siis olisi parempi tapa mitata partikkelin hetkellistä nopeutta? Voidaan tietysti yrittää tarkastella keskinopeutta lyhemmän aikavälin yli, jolloin se toivottavasti on lähempänä hetkellistä nopeutta. Mutta kuinka lyhyt aikaväli on riittävän lyhyt? Tämä oletetettavasti riippuu tarkasteltavan liikkeen luonteesta sekä siitä, kuinka paljon virhettä ollaan valmiit sietämään. Joka tapauksessa tulos on aina käytetystä aikavälistä riippuva aproksimaatio. Jos hetkelliselle nopeudelle ajanhetkellä on olemassa jokin aikavälin pituudesta riippumaton arvo, tulee meidän luultavasti saada sille sitä parempia aproksimaatioita, mitä pienemmäksi tehdään ja välttämätön johtopäätös on, että hetkellinen nopeus saavutetaan lopulta raja-arvona
.
Yleisemmin funktiota kutsutaan derivoituvaksi pisteessä , jos raja-arvo
on olemassa. Edelleen tällöin kyseistä raja-arvoa merkitään ja kutsutaan funktion derivaataksi pisteessä .
Hetkellinen nopeus ajanhetkellä määritellään siis paikan derivaattana . Ainakin klassisessa fysiikassa voidaan olettaa, että hetkellinen nopeus on olemassa ja paikka on siis derivoituva ajan funktiona. Yleisemmin funktion derivaattaa voi ajatella muutosnopeuden mittana abstraktimmassa mielessä: mitä suurempi positiiviluku on, sitä nopeammin funktio kasvaa pisteen ympäristössä, ja vastaavasti mitä pienempi negatiivinen luku, sitä nopeammin funktio vähenee.
Edeltävä fysikaalinen esimerkki on hiukan keinotekoinen, sillä yleensä haluamme tarkastella liikettä kolmessa ulottuvuudessa pelkän yhden sijasta. Tällöin partikkelin paikkaa ajanhetkellä kuvaa reaaliluvun sijasta sen paikkavektori , joka siis osoittaa origosta partikkelin sijaintipaikkaan. Samoin keskinopeus ajanhetkien ja välillä on kolmiulotteisen avaruuden vektori
.
Yleisesti vektoriarvoinen funktio on derivoituva pisteessä , jos
.
on olemassa, missä tapauksessa kyseistä raja-arvoa nimitetään funktion derivaataksi pisteessä . Vastaavasti kuin yksiulotteisessa tapauksessa hetkellinen nopeus saadaan keskinopeuden raja-arvona ja se on samalla vektoriarvoisen paikkafunktion derivaatta.
Reaalimuuttujan vektoriarvoisen funktion derivointi on täten normaalin määritelmän suoraviivainen yleistys, mistä ei kaiketi lukion matematiikan opetuksessa yleensä puhuta. Koska se kuitenkin edellä esitetyllä tavalla erittäin kiinteästi liittyy alkeisfysiikkaan, saattaisi sitä olla paikallaan lyhyesti käsitellä. Pieneksi ongelmaksi voi muodostua se, että määritelmä vaatii pohjakseen vektoriarvoisen funktion raja-arvon määritelmän. Se kuitenkin on analoginen yksiulotteisen tapauksen kanssa ja sitäpaitsi tavanomaisen reaaliarvoisen funktion raja-arvon täsmälliseen määritelmäänkään ei yleensä juurikaan kiinnitetä lukio-opetuksessa huomiota, joten vektoriarvoisen funktion raja-arvon täsmällisen määritelmän voinee varmaankin tarvittaessa sivuuttaa ja yrittää tehdä käsitteen intuitiivisesti ymmärrettäväksi muutamilla hyvin valituilla esimerkeillä. Luonnollisesti kolmiulotteinen Euklidinen avaruus voidaan sekä raja-arvon että derivaatan määritelmässä korvata myös kaksiulotteisella avaruudella tai korkeampiulotteisella avaruudella , missä , tai vielä yleisemmin millä tahansa normiavaruudella.
Sekä keskinopeus että hetkellinen nopeus ovat vektorisuureita. Hetkellistä nopeutta kuvaavan vektorin pituutta kutsutaan hetkelliseksi vauhdiksi. Arkikielessä nopeus ja vauhti ovat usein synonyymejä, mutta fysiikassa ne on pidettävä tiukasti erillään, sillä nopeudella on sekä suuruus että suunta kun taas vauhti on skalaarisuure, jolla on pelkkä suuruus. Keskivauhti puolestaan saadaan jakamalla kuljettu matka siihen käytetyllä ajalla. Pieni sekaannuksen vaara liittyy siihen, että keskivauhti ei ole keskinopeuden normi eli pituus kuten naiivi interpolointi hetkellisen vauhdin tilanteesta ehdottaisi . Ajatellaanpa esimerkiksi tilannetta missä heitetään kivi suoraan ylös ja annetaan pudota takaisin lähtötasolle. Tällöin keskinopeus on nolla, sillä se riippuu vain lähtö- ja saapumispaikan vektorierotuksesta, joka tietysti on nolla. Sen sijaan keskivauhti riippuu näiden pisteiden välillä kuljetusta polusta, tämällisemmin sen pituudesta, ja sillä on täten positiivinen arvo.
Intuitio 2: derivaatta parhaana lineaarisena aproksimaationa
Oletetaan, että on derivoituva pisteessä . Merkitään
kun . Derivaatan määritelmän nojalla . Ratkaisemalla saadaan
aina, kun ja . Kaavan mukainen esitys on voimassa myös pisteessä ja funktio tulee jatkuvaksi kyseisessä pisteessä, kun määritellään . Tästä saadaan tärkeä aproksimaatio
.
Aproksimaatiossa tehtävä virhe on siis ja, koska , aproksimaatio on hyvä kun on riittävän lähellä pistettä .
Jos on olemassa sellainen raaliluku ja sellainen funktio , että ja kaikilla funktiolle pätee esitys
,
niin funktiota kutsutaan differentioituvaksi pisteessä ja kyseistä esitystä funktion differentiaalikehitelmäksi tämän pisteen suhteen. Edellä on nähty, että derivoituva funktio on differentioituva valinnalla . Kääntäen, jos on differentioituva pisteessä , niin differentiaalikehitelmästä saadaan
kun .
Täten on derivoituva pisteessä ja . Differentioituvuus ja derivoituvuus ovat siis funktion tapauksessa yhtäpitäviä käsitteitä.
Differentiaalikehitelmän kautta saatiin toinen, vaihtoehtoinen määritelmä derivaatalle. Edelleen tulkitsemalla differentiaalikehitelmä geometrisesti saadaan myös vaihtoehtoinen tapa ajatella derivaattaa. Mitä tahansa muotoa , missä on reaalinen vakio, olevaa funktiota kutsutaan jatkossa lineaariseksi aproksimaatioksi funktiolle pisteen ympäristössä, sillä sen kuvaaja on suora, joka leikkaa funktion kuvaajan pisteessä . Funktion ollessa differentioituva on differentiaalikehitelmästä saatava arvoa vastaava aproksimaatio on kaikista lineaarisista aproksimaatioista paras . Tämä saattaa olla aiemmin sanotun perusteella jo jokseenkin selvää, mutta viimeistenkin epäilysten hälventämiseksi annettakoon seuraavaksi vielä formaali perustelu.
Derivaatan määritelmää käyttämällä saadaan raja-arvo
.
Kun , , ja täten edelleen
.
Näin ollen pisteen riittävän pienessä ympäristössä pätee
,
mistä edelleen kertomalla puolittain luvulla saadaan
.
Toisin sanoen pisteen riittävän pienessä ympäristössä aproksimaatio on lähempänä funktion todellista arvoa kuin aproksimaatio .
Parhaan lineaarisen aproksimaation kuvaajaa
kutsutaan funktion kuvaajan tangenttisuoraksi pisteessä . Derivaattaa on tangenttisuoran kulmakerroin. Tämän intuition mukaisesti differentioituvat eli derivoituvat funktiot ovat sellaisia kuvauksia, joita voidaan aproksimoida hyvin lineaarisesti (eli niillä on olemassa tangenttisuora). Edellä differentioituvuus ja differentiaalikehitelmä on määritelty vain reaalimuuttujan reaaliarvoisille funktioille, mutta vastaavat määritelmät voidaan tehdä myös reaalimuuttujan vektoriarvoisille funktioille ja myös tällöin derivoituvuus ja differentioituvuus ovat yhtäpitäviä käsitteitä. Sen sijaan tarkasteltaessa funktioita, joiden määritysjoukko on useampiulotteinen (eli argumentti on vektori), ei derivaatan määritelmä erotusosamäärän raja-arvona ole mielekäs, koska erotusosamäärän nimittäjään tulisi tällöin vektori ja vektorilla jakamista ei ole määritelty. Differentioituvuuden määritelmä on kuitenkin sopivasti tulkittuna varsin helppo yleistää myös tähän tapaukseen. Esimerkiksi jatkuvan funktion tapauksessa kuvaaja on kolmiulotteisen avaruuden kaksiulotteinen pinta ja intuitiivisesti on differentioituva pistessä , jos funktion kuvaajaa voidaan pisteen ympäristössä aproksimoida hyvin sopivalla kolmiulotteisen avaruuden tasolla (= tangenttitaso). Emme kuitenkaan paneudu näihin yleistyksiin tarkemmin tässä yhteydessä.