由问题的起源看导数的定义I

E生活播 855浏览 10


前言

在高中的微积分教学脉络中,一定先教授极限的观念与函数的极限,然后在进入微分单元时,直接定义何谓导数,即多项式函数 \(f(x)\) 在点 \((a,f(a))\) 的导数为 \(f'(a)=\lim_{x\rightarrow a}\frac{f(x)-f(a)}{x-a}\),然后再说明导数的意义以及应用。

然而为何导数要这样定义?我们在定义一个数学物件之前,通常是问题导向的,有需要,才有发明。那幺导数或是微积分来自于什幺需求?为何会导致这样的定义形式?在这一系列的文章中,笔者试图透过这一段数学史的发展,从问题的源头说起,经由费马求极值与牛顿求切线的方法,并利用问题来学习与思考,最后理解何以会以 \(f'(a)=\lim_{x\rightarrow a}\frac{f(x)-f(a)}{x-a}\) 这种形式来定义导数的必然性。

问题的来源

在数学发展史上,随着解析几何的发明与函数观念的採用,微积分技术的出现似乎已水到渠成,而当时十七世纪科学研究与应用的需求,更为微积分技术的产生增强了社会脉络面向的因素。在当时,主要的问题有四个类型:

在前面的四个问题类型中,前面三个问题本质上都是一种变量的瞬间变化率,而第四个问题为前三个的逆问题。

以求瞬间速度为例,当物体以变速运动时,每一瞬间此物体都有一个瞬时速度,但是若用平均速度的求法来看,此时移动距离是0,所花的时间也是0,而 \(\frac{0}{0}\) 是无意义的,所以,必须让此时的变量时间有一段微小的变化(即微小的时间间隔),藉此来讨论运动体在这一点左右的平均速度变化率。

当这个微小的增量极微小,或是说可以无限小时,变化率所逼近的数,即为所求的瞬时速度或切线斜率。然而,当吾人假设微小的增量然后顺利求出变化率 \(\frac{\Delta y}{\Delta x}\) 之后,又该怎幺让这个微小的增量「消失」呢?在微积分的基础完善之前,许多伟大的数学家都曾纠结在这个问题上,微积分的方法也因为这一个问题备受攻击。

费马求极值的方法

在费马于1637年寄出的一封信中,包含了他如何求函数极大值的方法,其中并收录了他于1629年发现的切线求法:

求极大值与极小值的全部理论以二个未知量和下述法则为基础:

设 \(a\) 是问题中的任一未知量,让我们用包含 \(a\) 的次方的诸项来表示极大值或极小值。现在用 \(a+e\) 来代替原来的未知量 \(a\),并且用包含 \(a\) 和 \(e\) 次方的诸项来表示极大值或极小值。然后使这两个极值表达式相逼近 (adequate,Diophantus的术语,表示尽可能的逼近一个数),并消去公共项,…用 \(e\) 或 \(e\) 的高次方除各项,使 \(e\) 从至少有一项中消失,然后捨弃所有仍有 \(e\) 的项,使两边的剩余项相等。…最后这个方程式的解所产生的 \(a\)值,代入原来的表达式就可得出极大值或极小值。

这里举一个例子:

将线段 \(AC\) 分成两段,分段点 \(E\),使得 \(AE\times EC\) 有最大值。

由问题的起源看导数的定义I

费马的作法是这样的,先假设 \(AC=b\),分成的两线段长中一段为 \(a\),所以另一段长为 \(b-a\),

它们的乘积 \(AE\times EC\) 即为 \(a(b-a)=ba-a^2\),

我们要的就是这个积的极大值,这个也就是变数 \(a\) 的函数 \(f(a)\)。

然后让 \(a\) 有一个微小的增量 \(e\),

即第一条线段为 \(a+e\) (\(e\) 为微小的变化量),第二线段将为 \(b-a-e\),

它们的积变为 \(f(a+e)=(a+e)(b-a-e)=ba-a^2+be-2ae-e^2\);

他说:「这个表达式必须逼近前一个表达式」,

也就是说 \(ba – {a^2} + be – 2ae – {e^2}\sim ba – {a^2}\),消去公共项后,

得 \(be\sim 2ae+e^2\),再消去 \(e\) 得 \(b=2a\)。为了解决所提问题,最后必须取 \(a\) 为 \(b\) 的一半。

费马最后说:「我们很难指望有更一般的方法了。」

费马求极大值的基本想法,就如同刻卜勒(Johannes Kepler, 1571~1630)在《测量酒桶的新立体几何》中观察到的结果一样:「在最大值附近,在两端的减少开始变得难以察觉」。所以,当a为极大值产生时的线段长,那幺在a的附近,如果增加了微小的长度e,那幺,增加后的乘积(函数值)与原本的差异「难以察觉」,于是,费马只好以「将他们尽可以的逼近」的说法来表达。

在费马的方法中,我们可以发现,以现在的符号来理解的话,

他的方法本质上即是计算当 \(e\) 是个很微小的量时(亦即趋近于 \(0\)),

让 \(\frac{f(a+e)-f(a)}{e}\) 这个值「尽可能的逼近」\(0\),

只是在「不敢提」或是没有完备的极限概念的情形下,

费马仅能以如此模糊的方式说明这个「微小增加量」的处理原则:

尽可能的逼近,将 \(e\) 一下子当成不等于 \(0\) 的约分掉,一下子又当成等于 \(0\) 的忽略不计消失掉,

这一点接下来的牛顿也没有处理的比较好,只是将方法精鍊许多而已,

我们下一篇文章在详细说明。

连结:由问题的起源看导数的定义II

参考文献

Calinger, R. ed. (1995). Classics of Mathematics. New Jersey: Prentice-Hall, Inc.Katz, Victor J. (1993). A History of Mathematics: An Introduction. New York: HarperCoollins College Publishers.李文林主编 (2000).《数学珍宝》,台北:九章出版社。Kline, M. (1983).《数学史—数学思想的发展》(林炎全、洪万生、杨康景松译),台北:九章出版社。Kline, M.(2004).《数学确定性的失落》(赵学信、翁秉仁译),台北:台湾商务印书馆。