原创 [转]C++标准库

2008-4-29 10:31 2980 2 2 分类: 软件与OS

(这篇东东转的有点早,因为还没有能完全理解。而且怀疑不是一两天能读懂的。不过好东东,先收下。)
C++标准库非常大。在C++标准中,关于标准库的规格说明占了密密麻麻300多页,这还不包括标准C库,后者只是 "作为参考"包含在C++库中。

当然,并非总是越大越好,但在现在的情况下,确实越大越好,因为大的库会包含大量的功能。标准库中的功能越多,开发自己的应用程序时能借助的功能就越多。C++库并非提供了一切(没有提供并发和图形用户接口的支持),但确实提供了很多。几乎任何事都可以求助于它。

因为标准库中东西如此之多,你所选择的类名或函数名就很有可能和标准库中的某个名字相同。为了避免这种情况所造成的名字冲突,实际上标准库中的一切都被放在名字空间std中。但这带来了一个新问题。无数现有的C++代码都依赖于使用了多年的伪标准库中的功能,例如,声明在,,等头文件中的功能。现有软件没有针对使用名字空间而进行设计,如果用std来包装标准库导致现有代码不能用,将是一种可耻行为。

慑于被激怒的程序员会产生的破坏力,标准委员会决定为包装了std的那部分标准库构件创建新的头文件名。生成新头文
                                 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~指前面的伪标准库吗?好像有点知道std以及等是咋来的了
  件的方法仅仅是将现有C++头文件名中的 .h 去掉,方法本身不重要,正如最后产生的结果不一致也并不重要一样。所以变成了,变成了,等等。对于C头文件,采用同样的方法,但在每个名字前还要添加一个c。所以C的变成了,变成了,等等。最后一点是,旧的C++头文件是官方所反对使用的(即明确列出不再支持),但旧的C头文件则没有(以保持对C的兼容性)。实际上,编译器制造商不会停止对客户现有软件提供支持,所以可以预计,旧的C++头文件在未来几年内还是会被支持。
所以,实际来说,下面是C++头文件的现状:

· 旧的C++头文件名如将会继续被支持,尽管它们不在官方标准中。这些头文件的内容不在名字空间std中。
· 新的C++头文件如包含的基本功能和对应的旧头文件相同,但头文件的内容在名字空间std中。(在标准化的过程中,库中有些部分的细节被修改了,所以旧头文件和新头文件中的实体不一定完全对应。)
· 标准C头文件如继续被支持。头文件的内容不在std中
· 具有C库功能的新C++头文件具有如这样的名字。它们提供的内容和相应的旧C头文件相同,只是内容在std中。

所有这些初看有点怪,但不难习惯它。最大的挑战是把字符串头文件理清楚:是旧的C头文件,对应的是基于char*的字符串处理函数;是包装了std的C++头文件,对应的是新的string类;是对应于旧C头文件的std版本。如果能掌握这些,其余的也就容易了。

关于标准库,需要知道的第二点是,库中的一切几乎都是模板。iostream帮助你操作字符流,但什么是字符?是char吗?是wchar_t?是Unicode字符?一些其它的多字节字符?没有明显正确的答案,所以标准库让你去选。所有的流类(stream class)实际上是类模板,在实例化流类的时候指定字符类型。例如,标准库将cout类型定义为ostream,但ostream实际上是一个basic_ostream类型定义(typedef )。

类似的考虑适用于标准库中其它大部分类。string不是类,它是类模板:类型参数限定了每个string类中的字符类型。complex不是类,它是类模板:类型参数限定了每个complex类中实数部分和虚数部分的类型。vector不是类,它是类模板。如此不停地进行下去。
在标准库中无法避开模板,但如果只是习惯于和char类型的流和字符串打交道,通常可以忽略它们。这是因为,对这些组件的char实例,标准库都为它们定义了typedef,这样就可以在编程时继续使用cin,cout,cerr等对象,以及istream,ostream,string等类型,不必担心cin的真实类型是basic_istream以及string的真实类型是basic_string。

标准库中很多组件的模板化和上面所建议的大不相同。再看看那个概念上似乎很直观的string。当然,可以基于 "它所包含的字符类型" 确定它的参数,但不同的字符集在细节上有不同,例如,特殊的文件结束字符,拷贝它们的数组的最有效方式,等等。这些特征在标准中被称为traits,它们在string实例中通过另外一个模板参数指定。此外,string对象要执行动态内存分配和释放,但完成这一任务有很多不同的方法。哪一个最好?选择:string模板有一个Allocator参数,Allocator类型的对象被用来分配和释放string对象所使用的内存。

这里有一个basic_string模板的完整声明,以及建立在它之上的string类型定义(typedef);可以在头文件中找到它(或与之相当的什么东西):

namespace std {
   template            class traits = char_traits,
                 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
            class Allocator = allocator >
                 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~和前面对应,但不明白
      class basic_string;
   typedef basic_string string;
}

注意,basic_string的traits和Allocator参数有缺省值。这在标准库中是很典型的做法。它为使用者提供了灵活性,但对于这种灵活性所带来的复杂性,那些只想做 "正常" 操作的"典型" 用户却又可以避开。换句话说,如果只想使用象C字符串那样的字符串对象,就可以使用string对象,而不用在意实际上是在用basic_string, allocator >类型的对象。

通常可以这么做,但有时还是得稍稍看看底层。例如,声明一个类而不提供定义具有优点;它还指出,下面是一种声明string类型的错误方法:
class string;                    // 会通过编译,

先不要考虑名字空间,这里真正的问题在于:string不是一个类,而是一个typedef。如果可以通过下面的方法解决问题就太好了:
typedef basic_string string;
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~这个好像是深入了解内部后的做法,不知道我说的对不对

但这又不能通过编译。"所说的basic_string是什么东西?" 编译器会奇怪 ---- 当然,它可能会用不同的语句来问你。所以,为了声明string,首先得声明它所依赖的所有模板。如果可以这么做的话,就会象下面这样:

template struct char_traits;
template class allocator;
template,
class Allocator = allocator >
class basic_string;
typedef basic_string string;

//下面就读不懂啦 一头雾水
//下面就读不懂啦 一头雾水

然而,你不能声明string。至少不应该。这是因为,标准库的实现者声明的stirng(或std名字空间中任何其它东西)可以和标准中所指定的有所不同,只要最终提供的行为符合标准就行。例如,basic_string的实现可以增加第四个模板参数,但这个参数的缺省值所产生的代码的行为要和标准中所说的原始的basic_string一致。那到底该怎么办?不要手工声明string(或标准库中其它任何部分)。相反,只用包含一个适当的头文件,如。

有了头文件和模板的这些知识,现在可以看看标准C++库中有哪些主要组件:
· 标准C库。它还在,还可以用它。虽然有些地方有点小的修修补补,但无论怎么说,还是那个用了多年的C库。

· Iostream。和 "传统" Iostream的实现相比,它已经被模板化了,继承层次结构也做了修改,增强了抛出异常的能力,可以支持string(通过stringstream类)和国际化(通过locales)。当然,你期望Iostream库所具有的东西几乎全都继续存在。也就是说,它还是支持流缓冲区,格式化标识符,操作子和文件,还有cin,cout,cerr和clog对象。这意味着可以把string和文件当做流,还可以对流的行为进行更广泛的控制,包括缓冲和格式化。

· String。string对象在大多数应用中被用来消除对char*指针的使用。它们支持你所期望的那些操作(例如,字符串连接,通过operator[]对单个字符进行常量时间级的访问,等等),它们可以转换成char*,以保持和现有代码的兼容性,它们还自动处理内存管理。一些string的实现采用了引用计数,这会带来比基于char*的字符串更佳的性能(时间和空间上)。

· 容器。标准库提供了高效的容器实现:vector(就象动态可扩充的数组),list(双链表),queue, stack,deque,map,set和bitset。但多少可以作为补偿的一点是, string是容器。这很重要,因为它意味着对容器所做的任何操作对string也适用。
标准库规定了每个类的接口,而且每条接口规范中的一部分是一套性能保证。所以,举例来说,无论vector是如何实现的,仅仅提供对它的元素的访问是不够的,还必须提供 "常量时间" 内的访问。如果不这样,就不是一个有效的vector实现。
很多C++程序中,动态分配字符串和数组导致大量使用new和delete,new/delete错误 ---- 尤其是没有delete掉new出来的内存而导致的泄漏 ---- 时常发生。如果使用string和vector对象(二者都执行自身的内存管理)而不使用char*和动态分配的数组的指针,很多new和delete就可以免于使用,使用它们所带来的问题也会随之消失。

· 算法。标准库就提供了大量简易的方法(即,预定义函数,官方称为算法(algorithm) ---- 实际上是函数模板),其中的大多数适用于库中所有的容器 ---- 以及内建数组(built-in arrays)。
算法将容器的内容当作序列(sequence),每个算法可以应用于一个容器中所有值所对应的序列,或者一个子序列(subsequence)。标准算法有for_each(为序列中的每个元素调用某个函数),find(在序列中查找包含某个值的第一个位置,count_if(计算序列中使得某个判定为真的所有元素的数量),equal(确定两个序列包含的元素的值是否完全相同),search(在一个序列中找出某个子序列的起始位置),copy(拷贝一个序列到另一个),unique(在序列中删除重复值),rotate(旋转序列中的值),sort(对序列中的值排序)。注意这里只是抽取了所有算法中的几个;标准库中还包括其它很多算法。
和容器操作一样,算法也有性能保证。例如,stable_sort算法执行时要求不超过0比较级(N log N) 。(stable_sort提供的性能必须和最高效的通用排序算法在同一个级别。)

· 对国际化的支持。不同的文化以不同的方式行事。和C库一样,C++库提供了很多特性有助于开发出国际化的软件。但虽然从概念上来说和C类似,其实C++的方法还是有所不同。例如,C++为支持国际化广泛使用了模板,还利用了继承和虚函数,这些一定不会让你感到奇怪。
支持国际化最主要的构件是facets和locales。facets描述的是对一种文化要处理哪些特性,包括排序规则(即,某地区字符集中的字符应该如何排序),日期和时间应该如何表示,数字和货币值应该如何表示,怎样将信息标识符映射成(自然的)明确的语言信息,等等。locales将多组facets捆绑在一起。例如,一个关于美国的locale将包括很多facets,描述如何对美国英语字符串排序,如何以适合美国人的方式读写日期和时间,读写货币和数字值,等等。而对于一个关于法国的locales来说,它描述的是怎么以法国人所习惯的方式完成这些任务。C++允许单个程序中同时存在多个locales,所以一个应用中的不同部分可能采用的是不同的规范。

· 对数字处理的支持。C++库为复数类(实数和虚数部分的精度可以是float,double或long double)和专门针对数值编程而设计的特殊数组提供了模板。例如,valarray类型的对象可用来保存可以任意混叠(aliasing)的元素。这使得编译器可以更充分地进行优化,尤其是对矢量计算机来说。标准库还对两种不同类型的数组片提供了支持,并提供了算法计算内积(inner product),部分和(partial sum),临差(adjacent difference)等。

· 诊断支持。标准库支持三种报错方式:C的断言,错误号,例外。为了有助于为例外类型提供某种结构,标准库定义了下面的例外类(exception class)层次结构:
                                             |---domain_error
                     |----- logic_error<---- |---invalid_argument
                     |                       |---length_error
                     |                       |---out_of_range
         exception<--|
                     |                       |--- range_error
                     |-----runtime_error<--|---underflow_error
                                             |---overflow_error
logic_error(或它的子类)类型的例外表示的是软件中的逻辑错误。理论上来说,这样的错误可以通过更仔细的程序设计来防止。runtime_error(或它的子类)类型的例外表示的是只有在运行时才能发现的错误。
可以就这样使用它们,可以通过继承它们来创建自己的例外类,或者可以不去管它。没有人强迫你使用它。
上面列出的内容并没有涵盖标准库中的一切。

标准库中容器和算法这部分一般称为标准模板库。STL中实际上还有第三个构件 ---- 迭代子(Iterator)。迭代子是指针似的对象,它让STL算法和容器共同工作。

STL是标准库中最具创新的部分,这并不是因为它提供了容器和算法(虽然它们非常有用),而是因为它的体系结构。简单来说,它的体系结构具有扩展性:可以对STL进行添加。当然,标准库中的组件本身是固定的,但如果遵循STL构建的规范,可以写出自己的容器,算法和迭代子,使它们可以和标准STL组件一起工作,就象标准组件自身之间相互工作一样。还可以利用别人所写的符合STL规范的容器,算法和迭代子,就象别人利用你的一样。使得STL具有创新意义的原因在于它实际上不是软件,而是一套规范(convention)。标准库中的STL组件只是具体体现了遵循这种规范所能带来的好处。

通过使用标准库中的组件,通常可以避免从头到尾来设计自己的IO流,string,容器,国际化,数值数据结构以及诊断等机制。这就有更多的时间和精力去关注软件开发中真正重要的部分:实现软件的其他功能

PARTNER CONTENT

文章评论0条评论)

登录后参与讨论
EE直播间
更多
我要评论
0
2
关闭 站长推荐上一条 /3 下一条