第一讲 连续统

第一讲 连续统

1.1 为什么数学分析必须从研究连续统开始?

“如果对于变量x的每一个值, 变量y都有唯一确定的值与之对应, 那么变量y称为变量x的函数.” 这句话可以用来开启高等数学领域的大门: 借助于这句话我们可以定义最重要的、 最首要的数学分析概念 ——函数关系. 在此概念中, 已经奠定了借助数学工具来把握自然现象和技术过程的完整思想的萌芽. 这就是为什么我们必须毫不含糊地要求这个定义有完全的、 无可指责的明确性, 其中的每一个字都不应有引起一点怀疑的阴影. 在此, 极小的一点歧义都可能危及所构筑的庄严的大厦. 这个大厦就是科学, 它就是以此概念为基础建造起来的, 而歧义会使得这座大厦不完善, 需要从根本上重建.

同时, 在对开始时的那个简单表述做进一步研究时, 我们发现在许多地方含义不明并且容许不同的解释. 我们在这里只注意这种不清楚的地方, 因为恰恰是试图把这一点最后弄清楚, 才把我们紧紧地引向了今天的讲义内容.

我们的定义包含了这样的字眼:“对于变量x的每一个值”. 为了不留下任何含糊之处, 我们必须无条件地向大家解释清楚术语“变量的值”的意义. 更重要的是, 定义中说到的是“每一个值”. 由此得知: 要想充分了解这个定义, 只掌握变量x的某些个别值的概念是不够的. 最要紧的是, 应当完全精密地理解这些值的整个集合, 整个的“储备”, 对于这些值中的任何一个都应当有一个确定的变量y的值与之对应. 我们应当了解在数学分析中, 称为已知函数的“定义域”的是什么东西.

什么是变量的个别值? 我们知道, 这就是数. 如果是这样, 则所有这些值的集合就是某些数的集合 —— 某个所谓的数集. 这个集合是什么样的? 它包含什么样的数? 我们从一开始就排除了虚数, 而假设所有的变量x和变量y的值都是实数. 那么 所有的实数都可以作为变量x的值吗? 如果不是, 那么什么样的值可以, 什么样的值不可以呢?

关于所有这一切, 我们的定义里没有说, 但这是可以理解的, 因为不可能对所有函数使用同一方式回答这个问题(实质上, 甚至对同一个函数在不同的问题中也不行). 函数的定义域既取决于该函数的性质, 也取决于那些特定的问题, 正是为了解决这些问题, 我们才在当前的研究中需要这个函数. 因为很容易明白, 同一个函数在不同的问题中是对不同的自变量值进行研究的. 对所有这一切, 我们知道许多例子. 例如函数y=x!只对正整数x研究才有意义(至少在初等数学范围内); 函数y=\lg~x只对x>0有意义, 等等. 可以容易地想出这类例子, 其中函数的自然定义域会是结构十分复杂的数集.

但如果我们自问: 在数学分析本身及其应用中, 最常见的变量x的值的集合是什么样的? 则应该说: 绝大多数情况下, 函数的这类定义域是“区间”(闭的或开的), 即介于两个已知数之间的所有实数的集合(包含或者除去这两个数或其中之一). 有时这个区间成为半直线(例如x>0), 这就表明, 变量x的值的集合是大于(或者小于)某个数的所有实数的集合(有时条件><要代之以条件\geqslant或者\leqslant). 最后, 还有这样的情形, 即区间变成整个直线, 即变量x的值可以是所有的实数. 这时则说函数的定义域是整个实轴或者“数直线”.

无论如何, 对于数学分析中的函数而言, 函数在其上发展且展现其个别特点的域、场地 —— 函数在其中才能成为自然科学和技术的强大数学武器的载体 —— 都是所有实数的集合. 这个集合在数学中称为连续统(确切地说,是线性连续统). 完全像培育植物之前必须仔细研究土壤一样, 在高等数学中, 我们期望热心人应当依靠科学, 在以函数关系概念为基础建筑这个科学的整个大厦之前, 仔细地研究这个概念赖以生存和发展的载体. 这就是为什么在所有认真而科学地编成的数学分析教程中, 连续统都是第一个研究对象. 且只有充分掌握其本质以及性质之后, 我们才可能转而对函数关系概念进行根本的研究. 连续统的结构并不像我们初看时设想的那么简单. 展现在我们眼前的实数世界是一个复杂的、 富含各种各样细节的结构. 直到现在, 对它作全面的研究仍在继续.

1.2 为什么没有建立完整的实数理论是不能研究连续统的?

如果这样, 连续统是什么样的? 存在什么样的实数? 何时以及为什么我们才能相信实际上已经掌握了所有实数?

在初等代数里, 我们掌握了全部有理数的集合, 即所有的整数和分数, 既有正的, 也有负的. 但很快我们就开始注意到, 这些数对我们来说是不够用的. 这是什么意思? 为什么不能只局限于有理数呢? 我们不能这样做, 是因为在有理数中没有如\sqrt{2} 这个数, 即找不到平方等于数2的有理数. 而为什么必须有这样的数呢? 因为边长为1的正方形的对角线的长度恰好为\sqrt{2} . 因此, 如果我们否定这个数的存在, 则对几何学中如此简单地生成的线段的长度, 就无法以任何数来表达了. 显然, 在这种基础上度量几何就不可能得到发展. 这就是说, \sqrt{2} 应当在实数中找到其位置. 但它在有理数中是没有位置的, 因此我们称它为无理数. 但这个\sqrt{2} 绝对不会只满足于我们承认它的存在: 它马上就会开始要求, 首先在有理数中间给它找到完全确定的位置, 即准确地指出什么样的有理数小于它以及什么样的有理数大于它(例如\sqrt{2}>1—— 正方形的对角线长大于其边长). 其次, 它要求我们要学会对它进行运算, 就像对有理数一样, 还要与有理数的运算相容(例如正方形的边与对角线的和等于1+\sqrt{2} , 这要求我们对这个数也赋予意义, 即把它归并入实数集合之中). 新数的所有这些要求都完全是根本性且合理的. 如果我们目前还不回答这些问题, 则只是因为我们马上还要将另外的许多新数引入我们的领域, 它们都全部毫无例外地对我们提出同样的要求, 所以最简单的办法是在今后同时满足所有这些新数的要求, 而不对每一个数个别地处理其细节.

\sqrt{2} 以后, 我们的领域自然且不可避免地要包含所有的有理数的平方根(正的和负的), 然后是立方根以及一般的所有形如

r^\frac{1}{n}\qquad\qquad\qquad\qquad\qquad\qquad\qquad(1)

的数, 其中r是任意的正有理数, n是任意一个\geqslant2的整数. 但众所周知, 事情还不止这些. 像前面作出正方形的对角线的表示一样, 还有许多具体的问题要求我们在一系列情况下把全部代数方程的根作为新的数. 只要已知方程的根尚未在我们已经引入的数中, 就会发生这样的情况, 因为我们不能否认这些根的存在, 也不能剥夺某些完全具体确定的量具有数的特征.

让我们在此方向上继续探索. 我们称形如P(x)=0的方程的所有根(实的)为代数数, 其中的P(x)为带整系数的任意多项式. 这样就把所有实的代数数都引入了我们的领域, 特别地, 引入所有形如(1)的数. 因为数r^\frac{1}{n}可定义为方程qx^n-p=0的根, 其中\dfrac{p}{q}=r是有理数r的一般分数表示. 更为特殊的情况, 任何有理数r=\dfrac{p}{q}作为方程qx-p=0的根也应属于代数数的集合之中.

可以很容易将代数数的整个领域进行“排序”, 即给出一个法则, 使得对任意两个代数数都能确定谁大谁小; 稍微困难一点 但还不太复杂的是, 确定一个法则对这些数进行任何通常的代数运算, 使得运算的结果仍然是代数数. 因此(这是关键点),对代数数进行代数运算只会得出代数数, 而不需要引入什么新的数.

也许我们现在就能够停下来, 认为实数域的构造完成了, 并且因此把所有的代数数的集合当作连续统?

众所周知, 我们不能这样做, 并且也熟知为什么不能这样做. 如果说对于许多代数理论而言, 我们可以满足于至此为止所构造的数, 但恰恰是对于数学分析而言, 限于代数数是完全不行的. 问题在于, 数学分析的第一步就是要对初等代数运算添加基本且最重要的分析运算 ——极限过程. 在很多情形下, 有完全具体的理由迫使我们了解这个或那个数序列极限的存在. 况且, 这个极限是作为有着具体而现实意义的数显现在我们面前的, 而且我们还期望今后对它进行代数运算和分析运算. 如果我们认为应当具有确定极限的任何代数数序列, 其极限实际上同样存在于代数数的范围之内, 则可假设代数数这个范围也就是连续统, 除代数数之外, 数学分析不再需要任何其他实数.

但事情并非如此. 如果我们取一个半径为1的圆, 并且作出其内接正多边形, 无限地增加其边数, 则所有这些多边形的周长都可以用代数数表示. 我们称这个数序列的极限为圆周长. 否认这个极限的存在就意味着在几何学中不能提及圆周的长度. 容易想象, 这种禁令不仅使几何学, 而且令所有其他用到圆形的精确科学都会崩溃.

与此同时, 可以证明, 在代数数中是没有这个极限的. 摆脱这种情形的出路在哪里? 显然, 我们不得不承认, 对于数学分析而言,只有代数数是不够用的, 必须再给它添加新的实数. 所有这些非代数数的实数通常称为“超越数”. 我们上面构造的数(半径为1的圆的周长)表示成2\pi, 这就意味着\pi是一个超越数. 在数学分析中, 另一个重要的超越数是我们熟悉的数{\rm e}=2.718\cdots, 正如我们了解的那样, 它也是从有理数出发由简单的极限过程产生的. e和\pi的超越性很晚才被证明, 即在19世纪的后半叶. 但是 引入超越数的必要性在较早就被提出, 即19世纪的中叶, 这是在另一些更简单且不太重要的例子中给出的(由法国数学家刘维尔作出).

这样, 我们的连续统仍然没有建成. 继续下去, 我们应当怎样做呢? 我们能否停留于此并且说:“连续统就是所有的代数数的全体, 再加上`根据需要, 从代数数通过极限过程得出的但其本身又不是代数数的数(像e和\pi, 作为超越数)'?”我们之所以提出这个问题,是因为大多数“简易的”数学分析教程正是以此为基础. 当然, 通常没有明说), 而回避了阐述完整的无理数理论.

不, 当然不能这样说, 也不能停留于此. 对此有一系列简单而有说服力的原因. 首先, 作为所有实数的总体的连续统应当定义为某个固定的集合(例如, 仿照上面定义所有代数数的集合的那种模式), 而不留下以后再添加越来越新的数的可能性. 其次, 在我们的初步定义中, “根据需要”这个说法显然缺少准确的内容. 如果我们面对一个没有代数数极限的代数数的序列, 从形式的观点来看,我们现在可以随意回答, 或者认为它有超越数极限或者完全没有极限. 如果不是从形式观点考虑, 而是按照具体的现实考虑来选取这个或那个解答, 那么无论它们多么必要, 这样做法在数学定义中却是不能允许的. 拒绝\pi这个数的存在, 在目前是极为不利的. 而在其他情况下,做类似的否认可能不会带来任何不便. 但很显然, 那个使我们“每当没有它就进行不下去”时就引入超越数的准则, 不论怎么说都不能成为数学准则. 最后, 我们也不能得出, 我们可以就此满足于以这样的途径引入的数, 因为新的数还得进行加法、 乘法, 进行极限过程(对数学分析来说, 不允许对这些数进行这些运算就什么也不能做). 我们从何能够确信, 所有的运算结果都将是我们的连续统的实数? 而如果不是, 我们又要补充它们, 可见我们的连续统还没有包含所有的实数.

可以看到, 我们不能坚持所持的这种立场, 即在给出一个或两个超越数后就说“等等”.这是不行的, 因为我们刚刚看到, 这样并没有定义任何连续统.

因此我们看到, 要对数学分析做完全的论证, 就不可避免地要建立实数的一般理论, 这个理论不能只限于构造一些作为例子的新数, 而要包含这种构造方法的一般原则, 按此原则可以刻画出所有实数的集合.

1.3 无理数的构造

在科学中有几种不同的连续统理论, 但所有这些理论在处理各自问题时其思想是完全一样的(牢记这一点很重要). 与这些原则性的统一比较起来, 对待它们之间的差别应当像我们在审查建筑物的建筑设计时对待结构的细节一样.

所有这些理论都有相同的目标,即把有理数集合作为最初的已知的依据, 而用统一的构造原则得到所有实数的整个集合. 这个原则在各种理论中形式不同, 但其间的相似之处还远不止于我们所指出的那些. 问题在于, 一种构造新的无理数的原则, 在所有的理论中, 尽管存在着形式上的区别, 但都基于同一思想, 这个思想就是: 在构造新数时, 基本的解析运算,即极限过程,起首要、 主导的作用, 所遇到的种种方法都可归结为它, 看做是它的特殊情形. 我们知道, 即使是整数的平方根也是适当选择的有理数序列(“近似根”)的极限, 另外一些情形也是如此.

据上所述, 为了更具体地认识连续统理论的构造, 我们没有必要在细节上研究所有这些不同的论证方法, 取其一作为模型就完全够了, 这里看到的所有原则上重要的内容对其他理论都是同样的. 我们将选择戴德金理论, 这并不是因为它相对其他理论有什么本质上的优越性, 而只是因为一种纯粹外在的理由: 占压倒性多数的最通用的教科书都采用它. 因此对读者来说不难寻找帮助, 可以在那些书里找到我们在表述中漏掉的细节.

1. 在着手引入无理数之前, 我们应当仔细地观察以R来表示的有理数的集合. 首先, 我们来注意该集合的一个很初等的性质: 在任何两个有理数 \textbf{\emph{r}}_\textbf{1} \textbf{\emph{r}}_\textbf{2} 之间总可以找到第三个有理数. 最为简单地, 注意到两者和的一半\dfrac{r_1+r_2}{2} 永远是位于r_1r_2之间的有理数, 就可以明白这一点. 作为这一事实的推论, 我们重复运用这一点, 马上就得出: 在r_1r_2之间始终存在有理数的无穷集合.

2. 现在, 我们注意观察在寻找或者定义\sqrt{2} 时产生的情况(我们取的是正根). 首先在有理数中(对我们来说,任何其他的数暂时还不存在)找这样的数: 它的平方等于数2. 容易发现, 这种(有理)数不存在(我们在这里将不给出中学教材中对此事实的人所熟知的算术证明). 这就表明: 无论我们选择什么有理数r, 都将有r^2<2或者r^2>2. 我们首先只研究正有理数的情形. 按照刚才的法则, 它们自然地分成两类: 正有理数r_1所构成的A类, 其中r_1^2<2; 以及正有理数r_2所构成的B类, 其中r_2^2>2. 因为r_1r_2都是正数, 则从r_1^2<2 <r_2^2可以得出r_1<r_2, 即\textbf{\emph{A}} 类的每一个数都小于 \textbf{\emph{B}} 类的每一个数. 很明显, 如果我们把零和一切负(有理)数都归入A类, 则上述结论不会改变. 此时我们得到将整个集合R分为AB两类的一个分割, 同时A类的每一个数都小于B类的每一个数. 我们约定, 若将集合R分成两个非空的类1(A,B), 且使A类中的每一个数都小于B类中的任意数, 就称它是一个分割(确切地说,是集合R的分划). 由此, 我们得到了集合R的某个确定的分割.

1即每一个类中至少包含一个数.

我们可以用各种完全初等的方法来建立集合R的分割. 例如, 把所有的有理数r_1\leqslant 5归入A类, 而把所有的有理数r_2>5归入B类, 显然也会得出集合R的一个确定的分割. 如果以通常的方式用直线上的点来表示数, 则所有的分割都很显然地可以用直线上的点分出两个集合的某个(有理数的)分划表示出来: 这两个集合中的第一个(A)整个位于第二个(B)的左边.

初看起来可能会认为, 集合R的所有分割都有同样的图像, 两个不同的分割彼此间的区别只在于做出它们的点的位置, 因而其中之一可以通过简单的移动而变为另一个. 但极为重要的是: 这种看法是错误的. 分割在自身结构上可能有着深刻的(且对于我们的目的来说,有重大价值的)差别.

实际上, 在后一个例子中, 存在一个数(即有理数, 我们暂时还没有任何其他的数), 它具有这样一条重要的性质, 即使得所有小于它的数都属于A类, 而所有大于它的数都属于B类. 在我们的例子中, 这个数很明显是数5. 具有这个性质的数我们将称之为已知分割的界限, 因而在这个例子中做出的分割是有界限的.

相反地, 在第一个(与\sqrt{2} 相关的)例子中这样的界限是没有的. 我们来证明这一点.

设(有理)数r是界限. 与对任何(有理)数一样, 应当或者有r^2<2,或者有r^2>2. 为确定起见, 设r^2<2. 按照界限的性质, 对每一个r'>r, 应有r'^2>2. 但若r<1, 则设r'=1, 就会得到矛盾的结果. 而如果r\geqslant 1, 则r^2\geqslant r, 记2-r^2=c(>0)且令r'=r+\dfrac{c}{4} , 我们有

r'^2=r^2+\dfrac{rc}{2}+\dfrac{c^2}{16}\leqslant r^2+\dfrac{r^2c}{2}+\dfrac{c^2}{16}=2-\dfrac{7}{16}c^2<2,

又出现矛盾, 因为由r'>r, 应有r'^2>2.

这样一来, 集合R的所有分割分为两个类型: 有界限的和没有界限的. 这里需要指出以下几点.

a) 一个分割不可能有两个界限. 如果rr'都是这样的界限, 且若r<r', 则由第一段存在这样的数r'', 使得r<r''<r'. 但此时根据界限的性质, 从r''>r得出r''\in B2, 而从r''<r'得出r''\in A, 这就造成矛盾.

2记号a\in M表示a是集合M的元素.

b) 如果界限存在, 很显然, 它或者是A类中最大的数, 或者是B类中最小的数. 如果界限不存在, 则A类中既没有最大的数, B类中也没有最小的数.

c) 每一个(有理)数r_0都是两个不同分割的界限. 其中一个的A类由数r\leqslant r_0构成(而B类则由数r'>r_0构成), 而另一个中的A类则由数r<r_0构成(而B类则由数r'\geqslant r_0构成).

d) 集合R的任何分割集都分成两种类型 —— 有界限的和没有界限的. 很显然, 这是集合R的内部结构特点. 这一事实总是完全成立的, 这里我们只用到R中的数是有理数, 而不必用到任何其他性质.

3. 现在, 数\sqrt{2} 的例子已经直接暗示我们以后的行动方式. 情况很明白: 从直观看, 我们看到的是数直线,即实轴, 我们在其上的确定位置将它分割, 而对于分割的位置, 我们找到了不与任何有理数对应的点. 我们不能拒绝考虑该点的存在. 没有它, 我们的直线, 即连续统(变量在变化时遍历的数的集合), 就失去了其连续性、 致密性, 而这正是连续统得其名的特征. 说得深刻一些, 我们直接看出, 如果使变量在变化时只取有理值, 则其从一个值变为另一个值时就不得不跨过其间的间隙. 从实际来讲, 正如我们之前就这点论述的, 如果我们容忍在两个类之间什么样的界限都不存在, 那么所有的应用科学(首先是几何学)必将感受极大的不便. 因此, 不仅是直观表示, 还是所有实际情形, 都要求我们把新的\sqrt{2} 引入到数域中来. 该数按照定义是分割的界限, 我们称之为无理数.

我们所选择的分割, 同那种没有(有理)界限的集合R的任何其他分割在原则上没有任何不同. 因此在一般理论的构造次序中, 我们自然地把我们的定义推广到任何这类分割的情形. 对于集合R的每一个没有有理界限的分割, 我们都提出某个新的无理数与之相应, 并且定义这个无理数就是分割的界限.

因此, 借助于这个统一的原则, 我们很快确定了整个无理数的集合. 连同早已存在的有理数, 它们就构成了所有实数的集合, 即连续统. 现在连续统已完全确定了.

1.4 连续统理论

当然, 连续统理论不会因为我们引入了构造无理数的原则就算是完成了. 实质上, 它还只能算是开始. 在能够说连续统理论实际上已经完善之前, 我们还必须要做的工作是极为宽广的. 首先, 我们应当对连续统进行排序, 即准确地确定在什么条件下可以认为一个已知的实数大于或者小于另一个已知的实数. 其次, 我们还要对实数定义其运算, 因为至今为止,我们对数1和\sqrt{2} 相加是什么还一无所知. 再次, 我们还要仔细证明这些运算具有我们在有理数域中所熟知的全部性质. 例如, 和与加法的次序无关(加法的交换律)是我们应当对任意实数重新加以证明的定理. 最后, 我们应当找到方法来证明: 我们定义的连续统确已适合所有实际和直观表示的需要(它也正是为满足这些需要而建立的). 当然, 在我们讲义的范围内要讲清此计划的各个细节是完全不可能的. 这也是极其枯燥的, 我们在今后只涉及该计划的某些原则上最重要的内容.

首先, 对连续统进行排序很容易. 设有两个实数\alpha_1\alpha_2, 需要确定其中哪个大, 哪个小. 如果两个数都是有理数, 则这个问题在算术中已经解决, 这里就不再讲它. 如果\alpha_1是无理数, 而\alpha_2是有理数, 问题也能马上得到解决: \alpha_1是集合R的某个分割的界限, 根据界限的定义, \alpha_2<\alpha_1或者\alpha_2>\alpha_1取决于有理数\alpha_2属于此分割的A类或B类. 最后, 设数\alpha_1\alpha_2是两个无理数. 因为这两个数互不相同, 则以它们为界限的两个分割也互不相同. 特别地, 这两个分割的左边的类A_1A_2也互不相同. 这就表明在这些集合中的某一个, 例如在A_2中可以找到这样一个有理数r,它是在A_1中所没有的. 从r\in A_2得出r<\alpha_2, 从r\bar{\in}A_13得出r\in B_1, 因而有r>\alpha_1. 所以存在这样的有理数r, 使得\alpha_1<r<\alpha_2. 在这种情况下,我们认为\alpha_1<\alpha_2; 如果相反地得到了这样的r', 使得\alpha_2<r'<\alpha_1, 则我们将认为\alpha_2<\alpha_1. 现在已经证明了两种情形之一一定成立, 因此我们对连续统的排序得以完成.

3记号a\bar{\in}M表示:a不是集合M的元素. [现在比较通用的记号是:a\notin M.——译者注]

然而, 以上只是完成了定义, 还必须证明其性质. 应当证明\alpha_1<\alpha_2\alpha_1>\alpha_2是不相容的; 从\alpha_1<\alpha_2一定且只能得出\alpha_2>\alpha_1, 反之亦成立; 最后, 从\alpha_1<\alpha_2\alpha_2<\alpha_3可以推得\alpha_1<\alpha_3. 总而言之, 实数之间的不等式服从有理数之间的不等式的同样基本规律. 读者会很容易证明所有这些命题.

顺便说一下, 我们上面所作的讨论表明, 在任何两个无理数之间总可以找到一个有理数. 我们知道, 如果两个已知数是有理数, 这是成立的. 现在设数r是有理数, 数\alpha是无理数, 且为确定起见设r<\alpha. 我们来证明此时在r\alpha之间能够找到有理数. 数\alpha是集合R的分割(A,B)的界限, 同时从r<\alpha推得r\in A. 但在有无理数界限的分割里, A类不含最大数, 因此存在有理数r'>r, 它像r一样属于A类且小于\alpha. 因而r<r'<\alpha, 这就是要证明的.

这样, 我们就证明了在两个任意的实数之间都可以找到一个有理数, 当然, 也就可以找到无穷多个有理数. 集合R的这个重要性质通常就说是: \textbf{\emph{R}} 是处处稠密的(在连续统中). 容易证明, 无理数集合也是处处稠密的. 为了说明这一点, 最简单的方法是研究所有形如r\sqrt{2} 的数的集合, 其中r是任意的有理数. 所有这样的数都是无理数, 它们就已构成了处处稠密的集合. 然而, 严格地说, 表达式r\sqrt{2} 只有在对实数定义了运算之后才有确切的意义. 我们现在转到这一点上来.

我们不可能研究这个问题的所有细节, 但要想弄清该定义的思想, 只要详细分析一个例子就足够了. 设\alpha_1\alpha_2是两个实数, \alpha_1+\alpha_2是它们的和. 数\alpha_1\alpha_2无论是有理数还是无理数, 在任何情况下,它们两个都是集合R的某个分割的界限. 我们分别以(A_1,B_1)(A_2,B_2)来表示这些分割. 其次, 设a_1,b_1,a_2,b_2表示属于相应的集合A_1,B_1,A_2,B_2的任意数. 很显然, 所有形如a_1+a_2的有理数都小于任何形如b_1+b_2的有理数. 我们现在证明这样的实数\alpha的存在性与唯一性, 使得对任意的a_1, a_2,b_1,b_2(当然属于相应的集合)都有

a_1+a_2\leqslant \alpha \leqslant b_1+b_2.

我们很自然地就会将这个数\alpha定义为数\alpha_1\alpha_2的和, 这样就在一切情况下确定了和的存在性和唯一性.

现在研究以下述方式定义的集合R的分割(A,B): 如果有理数r小于所有形如b_1+b_2的数, 我们将把它归入A类; 相反地,则归入B类(很容易证明, 集合R的这样定义的分划实际上是分割). 该分割的界限我们表之以\alpha. 很显然, 所有形如a_1+a_2的数属于A类, 而所有形如b_1+b_2的数属于B类. 因此

a_1+a_2\leqslant \alpha \leqslant b_1+b_2,\qquad\qquad\qquad\qquad\qquad\qquad\qquad(2)

即数\alpha实际上满足所提的条件. 余下的是确定其唯一性.

为此我们先来证明, 可以选择数a_1b_1使得其差b_1-a_1为任意小. 实际上, 设aA_1类中的任意的有理数, 且c为任意小的正有理数. 在有理数序列

a,~a+c,~a+2c,~\cdots,~a+nc,~\cdots

中, 第一项属于A_1类, 其后, 一般来说还有一些项也属于A_1类, 但从某个位置起所有后面的项都将属于B_1类, 因为a+nc随着n的增加在无限增加. 因此可以找到这样一个整数k, 使得

a+kc=a_1\in A_1,\quad a+(k+1)c=b_1\in B_1,

由此得知差b_1-a_1=c是任意小. 因此命题得证. 由于同样的理由, 数a_2,b_2之差, 还有a_1+a_2,b_1+b_2之差也可以选择为任意小.

现在设(还不知道这是否可能)存在着两个不同的实数\alpha\alpha'满足不等式(2), 且为确定起见设有\alpha<\alpha'. 正如我们了解的那样, 存在着这样一对有理数rr', 使得

\alpha<r<r'<\alpha';

这些关系连同不等式(2)一起表明: 任何形如a_1+a_2的数与任何形如b_1+b_2的数之间的距离必定超过一个常数r'-r. 这很显然与我们刚刚得出的结果相矛盾. 因此数\alpha的唯一性得证.

我们作出的加法的定义, 按其形式讲, 可以方便地把有理数加法所遵从的所有基本规律, 直接推广到任何实数的加法. 你们可尝试, 哪怕只对交换律试一下, 马上就会发现这些都是如此简单.

我们已经说过, 在这里将不再论及其他运算的定义以及它们所遵循的规律. 我们只提醒一下: 乘法最好类似于加法来定义, 而减法和除法则最好定义为逆运算.

我们现在转到这个问题的思路中最后一个极为重要的问题: 怎样证明我们定义的连续统实际上表现出连续性和稠密性呢? 作为数学分析的基础, 它们是必需的, 正因为数集R缺乏它们, 才迫使我们在适当的时候引入无理数.

回答这一问题, 要先回想一下, 为什么我们说集合R缺乏这种连续性. 这是指这样一件事实:在集合R的分割中具有这样一类, 它们不具有属于集合R的界限. 因此, 如果我们能证明,对于连续统来说, 这样的事实任何时候再也不存在, 即连续统的任何分割都有也属于连续统本身的界限, 则我们就能够认定这是令人满意的, 并且相信我们建立的连续统作为数学分析的基础, 能适合对它所提出的要求.

要避免一个误解, 即上面提出的命题不可能从以前的结果直接推得, 因为迄今为止我们所说的总是集合R的分割, 现在才第一次谈到连续统的分割. 但我们规定,连续统的分割的形式定义仍然没有改变.

现在来证明我们的论断. 设(A,B)是连续统的任意一个分割. 任何有理数, 更一般地说, 任何实数, 或者属于A类, 或者属于B类. 因此连续统的分割(A,B)就直接导出了集合R的某个完全确定的分割(A',B'). 设\alpha是作为分割(A',B')的界限的一个实数. 我们来证明, 它也是分割(A,B)的界限, 从而使得我们的命题得证.

现在需要证明:任何实数\alpha_1<\alpha都属于A类, 而任何实数\alpha_2>\alpha都属于B类. 由对称性, 只要证明第一个命题就够了. 设r为介于\alpha_1\alpha之间的有理数, 因为r<\alpha, 则

r\in A'\subset A4

4记号A\subset B表示:集合A包含于集合B之内.

而因\alpha_1<r, 则由此得出也有\alpha_1\in A. 这就是所要证明的.

1.5 基本引理

数学分析的逻辑基础就这样建立起来了. 当以此为基础逐步建立数学分析基础时, 我们当然不得不经常引证已经奠立的基础, 即直接回到我们所建立的实数的定义. 这必然会伴随众所周知的不便, 因为对此所必需的分割, 构造和研究通常都是十分繁琐的. 找到摆脱此困境的方法在科学上是极其有意义的, 因为它可以当作在数学科学中经常遇到的所有类似的逻辑结构的一种典范. 注意到, 在数学分析的发展历程中, 尽管在讨论中直接应用借助于分割给出的实数定义是很经常的, 但其中的多数应用在形式上是彼此十分相似的, 因此实际上几乎所有的这些应用都是按照三四种形式来完成的(当然, 每次都要添加特别的内容). 如果发现了这种情况, 再几十次地重复同一逻辑过程, 只是每次添加新的基本内容, 这不论是为了建立这门学科, 还是为了掌握这门学科都是很不经济的, 也是极为麻烦的.不过数学科学早就已经有了办法(当然是有充分根据的), 即在所有类似情况下, 通常把这种逻辑形式明显地表述为几个辅助命题(引理), 然后一劳永逸地证明这些引理, 这样以后就再也不必每次都重复这种作为该引理基础的形式结构, 而可以直接引用这已准备好了的引理. 证明了三四个这样的辅助命题, 我们就有可能在今后的任何时候都不用再来构造分割, 而只要引用一个基本引理来代替它. 这些引理就构成了把数学分析与其逻辑基础连接起来的几座桥梁. 毫无疑问,在不同的讲法中,这些基本引理的选择可以是各不相同的, 但在任何情况下都要尽可能地劝告学生, 要不惜时间和精力, 尽可能地掌握尽可能多的这类引理, 因为其中的每一个都各有作用, 能对将来的工作给以本质上的方便. 因此为掌握它们而花费的力气, 毫无疑问不会是徒然的浪费.

我们现在以几个例子给出这类引理的典型表述和证明.

1. 关于单调序列的引理. 如果对于任何n都有\alpha_n\leqslant \alpha_{n+1} 或者\alpha_n\geqslant \alpha_{n+1} , 则实数序列

\alpha_1,~\alpha_2,~\cdots,~\alpha_n,~\cdots \qquad\qquad\qquad\qquad\qquad\qquad\qquad(3)

称为单调的. 准确地说, 第一种情况是单调不减的, 第二种情况则是单调不增的. 如果存在这样一个正数c, 使得

|\alpha_n|<c\quad(n=1,2,\cdots),

则序列(3)称为有界的.

引理1 任何单调有界序列都有极限.

为确定起见, 设\alpha_n\leqslant \alpha_{n+1} |\alpha_n|<c(n=1,2,\cdots). 把连续统分成两个集合AB, 大于所有\alpha_n(例如数c)的任何实数放入B, 而其余的所有实数放入A. 很显然, 连续统的这个分划是一个分割. 设\alpha是该分割的界限. 我们来证明\mathop{\rm lim}\limits_{n\rightarrow \infty}\alpha_n=\alpha, 这就是引理1所要证明的.

首先指出, 对任意的n

\alpha_n\leqslant\alpha;

实际上, 当\alpha_n>\alpha时,依照界限的定义会有\alpha_n\in B, 这与集合B的定义相矛盾. 如果与我们的命题相反, \alpha不是序列(3)的极限, 则存在这样的正常数\varepsilon, 使得对数n的无穷集合有

\alpha-\alpha_n>\varepsilon,

由此得\alpha_n<\alpha-\varepsilon. 但由序列(3)的单调性知, 这个应该对无穷多个n值成立的不等式,应该对所有的 n成立. 按照集合B的定义, 由此得出\alpha-\varepsilon\in B. 但由\alpha-\varepsilon<\alpha知, 数\alpha-\varepsilon应当属于A类(因为\alpha是分割(A,B)的界限). 所得之矛盾证明了我们的论断.

当然, 在引理的条件中,单调性是不能丢掉的. 单从序列(3)的有界性不能得出极限的存在, 正如例子\alpha_n=(-1)^n所指明的那样.

关于单调序列的引理不仅在数学分析中得到大量的应用, 甚至在初等数学中也得到了大量的应用. 它在初等数学中常被作为“公理”, 甚至有时都没有考虑到, 如果没有掌握全部的实数, 这个“公理”就是不成立的. 这种缺陷不仅在初等数学里有, 而且在“简化”的数学分析教程里也有.

特别是, 对于几何学中圆的周长(即当边数无限增加时,圆内接正多边形周长的极限)的存在, 以及作为数学分析中最基本的数之一的{rm e}=\mathop{\rm lim}\limits_{n\rightarrow \infty}(1+\dfrac{1}{n})^n的存在, 利用这个引理进行证明是最简单的了.

与描述单调有界序列的基本特征的引理相比较, 关于连续变化变量的连续函数的下述引理, 对数学分析的意义也不相上下.

引理\textbf{1}' 若变量x增加且趋近于a, 并且函数f(x)在某个以点a为其右端点的区间上有界且单调, 则当x\rightarrow af(x)趋近于确定的极限.

这里函数f(x)在以a-\varepsilona为端点(\varepsilon >0)的区间内的有界性, 表明存在这样的数c, 使得

|f(x)|<c\quad (a-\varepsilon< x<a);

单调性则表明对该区间的任意一对数x_1x_2(x_1\neq x_2), 比值\dfrac{f(x_1)-f(x_2)}{x_1-x_2} 或者\geqslant 0, 或者\leqslant0.

引理1'的证明可以很简单地由引理1作出. 为确定起见, 设f(x)是不减的, 即当a>x_2>x_1>a-\varepsilon时有f(x_2)\geqslant f(x_1). 因为当n>\dfrac{1}{\delta}时有

a-\delta<a-\dfrac{1}{n}<a,

则增加的数序列a-\dfrac{1}{n}(n>\dfrac{1}{\varepsilon})落在以a-\varepsilona为端点的区间内且以a为极限. 数序列f(a-\dfrac{1}{n})(n>\dfrac{1}{\varepsilon})显然有界且不减. 因此由引理1, 存在极限\mathop{\rm lim}\limits_{n\rightarrow \infty}f(a-\dfrac{1}{n})=b. 如果数x充分靠近a, 则可以找到这样一个n=n(x), 使得

a-\dfrac{1}{n}\leqslant x<a-\dfrac{1}{n+1},

由函数f的单调性即得

f(a-\dfrac{1}{n})\leqslant f(x)\leqslant f(a-\dfrac{1}{n+1}).\qquad\qquad\qquad\qquad\qquad\qquad\qquad(4)

但当x\rightarrow a时很显然地有n\rightarrow \infty, 由此得出不等式(4)的左右两边都以b为其极限, 由此得出当x\rightarrow a时也有f(x)\rightarrow b, 引理1'由此得证.

2. 收缩区间套引理. 我们约定把以ab为端点的闭区间, 即满足不等式a\leqslant x\leqslant b的所有实数的总体记为, 而具同样端点的开区间, 即满足不等式a<x<b的所有实数x的总体记为(a,b). 如果区间序列

满足下述条件:

1^\circ a_n\leqslant a_{n+1}\leqslant b_{n+1}\leqslant b_n(n=1,2,\cdots), 即后面的每一个区间全部包含在前一个区间之内;

2^\circ \mathop{\rm lim}\limits_{n\rightarrow\infty}(b_n-a_n)=0, 即随着序号的无限增加, 区间的长度趋于零.

我们称之为收缩的区间套.

引理2 如果序列(5)是一个收缩的区间套, 则存在唯一的实数\alpha属于所有这些区间.

当然, 可以通过构造相应的分割来证明此引理(这样做时常是很有益的), 但是根据引理1来证明要简单得多. 实际上, 由条件1^\circ, 序列

a_1,~a_2,~\cdots,~ a_n,~\cdots

单调、 有界(后一点从a_n<b_1对任何n成立可以明显看出).据引理1, 序列有极限, 设

\mathop{\rm lim}\limits_{n\rightarrow \infty}a_n=\alpha.

因为对任何ka_n\leqslant b_k(n=1,2,\cdots), 所以也有

\alpha\leqslant b_k\quad (k=1,2,\cdots),

因此

a_n\leqslant \alpha\leqslant b_n\quad (n=1,2,\cdots),\qquad\qquad\qquad\qquad\qquad\qquad\qquad(6)

因此数\alpha属于每一个区间, 因而满足引理的条件. 其唯一性可以这样推得: 当有两个不同的数\alpha\beta满足不等式(6)时, 我们有(为确定起见设\alpha<\beta):

a_n\leqslant \alpha<\beta\leqslant b_n\quad(n=1,2,\cdots),

由此得

b_n-a_n>\beta-\alpha\quad(n=1,2,\cdots),

这与收缩的区间套的性质2^\circ相矛盾, 因而引理2得证.

应当指出: 对于引理2非常重要的是, 对每一个区间而言, 其端点a_n, b_n都要包括在内. 如果我们丢掉了这一点而以开区间a_n<x<b_n来代替, 则引理就可能不成立. 如开区间序列0<x<\dfrac{1}{n}(n=1,2,\cdots)就没有属于所有区间的公共点.

3. 海涅—博雷尔引理. 这个时代稍晚些才产生的辅助命题, 也时常成为证明数学分析中的定理的方便武器.

我们约定, 称一组(一般说来是无穷的)区间M覆盖了(闭的)区间, 如果这后一区间的每一个点都位于这组区间M中的至少一个区间的话.

引理3 如果开区间组 M5覆盖了区间, 则从中可以分出一个有限的开区间组M', M'也覆盖区间.

5原文误为“一组区间M”. 实际上, 如果这一组区间M是一组闭区间, 这个引理可能不成立. ——译者注

实际上, 如果区间{\it\Delta}_1=[a,b]不能被引理要求的有限个开区间覆盖, 则将其平分成两半, 我们可以断定, 其中至少有一个半区间也不能被有限覆盖(因为很显然, 如果两者都能被有限覆盖, 则整个区间{\it\Delta}_1也就被有限覆盖). 我们以{\it\Delta}_2来表示这不能被有限覆盖的一半(如果两者都不能被有限覆盖, 则{\it\Delta}_2可以表示其中任意一个). 再将{\it\Delta}_2平分成两半, 我们又可以断言, 其中至少有一个半区间(以{\it\Delta}_3表之)不能被有限覆盖. 可以把这个过程无限地进行下去, 这样区间{\it\Delta}_1,{\it \Delta}_2,{\it\Delta}_3, \cdots, 显然构成了一组收缩的区间套. 根据引理2, 存在唯一的点\alpha属于所有这些区间. 设{\it\Delta}为组M中包含点\alpha在其内的开区间. 因为当n\rightarrow\infty时区间{\it\Delta}_n的长度趋近于零, 同时\alpha\in{\it\Delta}_n,则对充分大的n就有{\it\Delta}_n\subset {\it\Delta}(因为开区间{\it \Delta}的长度不会为0), 于是得出矛盾: 区间{\it\Delta}_n按其定义不能被有限覆盖, 现在又只需组M的一个区间{\it\Delta}即可覆盖它. 引理3由此矛盾而得证.

现在我们不仅学会了建立数学分析的基础, 而且证明了三个最重要的辅助命题, 准备好了将此基础最方便地用于今后进一步构建基本的大厦的过程. 这座大厦将以什么方法耸立起来, 在其建筑过程中还会用到 什么样的基本概念、 思想和研究方法 —— 所有这些你们都将从后面的各讲中了解到.

目录