輝夜の永遠亭 - Lunatic Princess

fstream 文件 IO 点滴

很多时候较大数据量的文件 IO 总是成为瓶颈，为了提高效率，有时想要先将文件大块大块的读入再行处理。下面分析两种惯常的处理手法。

1. 将文件一次性读入 string 中。

貌似 std::getline 、 istream::getline 或是 operator<< operator>> 等都不提供一次读到文件结尾的机制，只有 istreambuf_iterator 可以做到：

ifstream in("input.txt");

string instr((istreambuf_iterator<char>(in)), istreambuf_iterator<char>());

string 的构造函数前一个参数要多加一层 () 以免编译器误认为是函数声明 = = ...

这样读入 string 会随着内容动态增长，空间不足时会触发额外的 realloc 及 copy 操作，为提高效率有必要预分配足够的空间：

ifstream in("input.txt");

in.seekg(0, ios::end);

streampos len = in.tellg();

in.seekg(0, ios::beg);

string instr;

instr.reserve(len);

instr.assign(istreambuf_iterator<char>(in), istreambuf_iterator<char>());

2. 将文件一次性读入 stringstream 中。

filebuf 和 stringbuf 无法直接通过 rdbuf() 重定向，因此从 filebuf 到 stringbuf 需要一次 copy 操作。最简单的方法是直接复制整个 streambuf ：

ifstream in("input.txt");

stringstream ss;

ss<<in.rdbuf();

与 string 的情况相同，这里同样也有一个空间 realloc 及 copy 的问题。但 streambuf 的缓冲区不是那么方便操作的，解决方法是我们给他手动指定一个空间：

ifstream in("input.txt");

in.seekg(0, ios::end);

streampos len = in.tellg();

in.seekg(0, ios::beg);

vector<char> buffer(len);

in.read(&buffer[0], len);

stringstream ss;

ss.rdbuf()->pubsetbuf(&buffer[0], len);

最后再顺便 BS 一下 VC 的 STL = =...

虽然 VC 的编译器效率没的说，但被 STL 拖后腿的话不就白搭了嘛。在文件 IO 方面 (fstream) 比起 MinGW (GCC 4.4.0) 带的要慢好几倍。GCC 的 fstream 格式化读写效率与 C 的比已经不分伯仲，以后应该还会有进一步的提升空间 (编译时格式控制 vs 执行时)

另外上面最后一段程序在 VS2008 (VC9.0) 下应该无法得到预想的结果，跟踪进去看了一下，VC 标准库里的 pubsetbuf 函数体居然是空的！内容如下(中间还有一层函数调用)：

virtual _Myt *__CLR_OR_THIS_CALL setbuf(_Elem *, streamsize)

        {       // offer buffer to external agent (do nothing)

        return (this);

        }

看来是等着我们来继承了啊 = = 。而在 MinGW (GCC 4.4.0) 中可以得到预期的结果。

关于 VC 中的 STL string 实现

今天小实验一下发现 VC9 的 STL string 实现中没有使用引用计数和写时拷贝

在 VC6.0 时默认还是有这两个特性的，从 VC7.0 开始貌似就取消了，大概是考虑到线程安全问题

如果我不用多线程，这两个特性应该还是可以一定程度上提高效率的吧

不然在返回一个 string 时是否也要考虑用 auto_ptr 了呢...

看来有必要自己实现一个 string ，或者偶尔考虑用一下其他库的...

不过从一致性考虑，感觉还是显式使用智能指针实现以上功能比较好，不然其他各种自定类型是不是也有必要封装一个 share_ptr 类似特性呢。

fstream 文件 IO 点滴

关于 VC 中的 STL string 实现

輝夜(tadvent)

Search

Categories

Hot Posts

New Messages

Links

New Comments

Tag Cloud

Counter

Meta