九天雁翎的博客
如果你想在软件业获得成功,就使用你知道的最强大的语言,用它解决你知道的最难的问题,并且等待竞争对手的经理做出自甘平庸的选择。 -- Paul Graham

《Inside C++ Object 》 阅读笔记(1), NRV(Named Return Value)

《Inside C++ Object 》 阅读笔记(1), NRV(Named Return

Value)

 

write by** 九天雁翎(JTianLing) –
blog.csdn.net/vagrxie
**

书其实看完了,因为实在公司抽中午吃饭剩余时间看的,所以其实一直没有好好的试验一下,现在将书带到家里好好的一个一个将感兴趣的测试一下了。

 NRV(Named Return Value)是我阅读《Inside C++ Object》碰到的第一个感兴趣的东西,书上面有Lippman的测试数据和侯捷的测试数据。当然,对于VS的效率一直没有报太大希望,但是不至于这个Lippman所说的编译器的义不容辞的优化都不做吧。可能因为侯捷用的VC5.0实在太老了,于是我自己决定测试一下。

 

首先在Linux下,我测试了一下。测试代码书上有,我还是贴一下:

#include <stdio.h>
#include <stdlib.h>
#include <memory>
#ifdef _WIN32
#include “jtianling.h”
#endif
using namespace std;

class CTest
{
    friend CTest foo(double);

public:
    CTest()
    {
       memset(array, 0, 100*sizeof(double));
    }
    // 以下面的语句决定是否进行NRV
    CTest(const CTest&t)
    {
       memcpy(this, &t, sizeof(CTest));
    }

private:
    double array[100];
};

CTest foo(double val)
{
    CTest local;

    local.array[0] = val;
    local.array[99] = val;

    return local;
}

int main(int argc, char* argv[])
{
#ifdef _WIN32
    double timenow = jtianling::GetTime();
#endif
    for(int i=0; i<10000000; ++i)
    {
       CTest t = foo(double(i));
    }

#ifdef _WIN32
    timenow = jtianling::GetTime() - timenow;

    cout <<timenow;
#endif
    system("pause");
    exit(0);
}

 

因为在linux下我有sheel下的time可以用,所以不需要自己在程序中计时(实际上这还导致linux下的时间会长一些,因为记上了循环外的部分,包括了main的调用等),windows下用我自己的带有gettime的一个库。

效果是很有意思的,在linux下测试得出不进行NRV优化,进行NRV优化(g++ -O1)和进行NRV优化(g++ -O3)时,在我的P3 800的可怜机器上得出的结果是8.61,5.08,4.67。

在我的windows下用VS 2005 SP1编译,跑在E2160的机子上,debug时,没有拷贝构造,即理论上不进行NRV优化时的时间是5.07,加上拷贝构造函数,即理论上进行NRV时的时间的确和侯捷一致,时间增加到了5.55.可见起码在关闭优化的时候,VS2005没有进行优化。

开启优化呢?更绝得事情来了,VS2005将整个循环优化掉了-_-!作弊!时间虽然短到-7e,但是我也不承认:)

罪证拷贝如下:

00401038  call        edi
0040103A  fild        qword ptr [esp+30h]
0040103E  fild        qword ptr [___@@_PchSym_@00@UnbLwlxfnvmgUerhfzoLhgfwrlLCAAFUkilqvxghUgvhgxifmgrnvUgvhgkrhzhxrrUivovzhvUhgwzucOlyq@+8 (403390h)]
00401044  fdivp       st(1),st
00401046  mov         edx,dword ptr [___@@_PchSym_@00@UnbLwlxfnvmgUerhfzoLhgfwrlLCAAFUkilqvxghUgvhgxifmgrnvUgvhgkrhzhxrrUivovzhvUhgwzucOlyq@+8 (403390h)]
0040104C  fstp        qword ptr [esp+30h]
00401050  or          edx,dword ptr [___@@_PchSym_@00@UnbLwlxfnvmgUerhfzoLhgfwrlLCAAFUkilqvxghUgvhgxifmgrnvUgvhgkrhzhxrrUivovzhvUhgwzucOlyq@+0Ch (403394h)]
00401056  jne         main+67h (401067h)
00401058  push        offset ___@@_PchSym_@00@UnbLwlx

会发现循环完全被抛弃掉了,不过虽然影响了测试,但是这个时候我还得承认这是条还算合理的优化,因为在release时,这个循环不能给我们带来任何我们想要的东西。实际上以前就经常碰到这样的问题,MS老是喜欢将它认为无意义的东西直接优化没有,。。。。常常影响测试。。。。。呵呵,今天我是的确想知道,它到底有没有NRV优化,于是,让这个循环有意义吧。

将程序改成如下状态

#include "jtianling.h"
#include <stdio.h>
#include <stdlib.h>
#include <memory>
using namespace std;

int gi = 1;
int gj = 1;

class CTest
{
    friend CTest foo(double);

public:
    CTest()
    {
       gj++;
       memset(array, 0, 100*sizeof(double));
    }

    //CTest(const CTest&t)
    //{
    //  gj++;
    //  memcpy(this, &t, sizeof(CTest));
    //}

    double array[100];
};

CTest foo(double val)
{
    CTest local;

    local.array[0] = val;
    local.array[99] = val;

    return local;
}

int main(int argc, char* argv[])
{
    double timenow = jtianling::GetTime();
    for(int i=0; i<10000000; ++i)
    {
       CTest t = foo(double(i));
       gi = t.array[99];
    }

    timenow = jtianling::GetTime() - timenow;

    cout <<timenow <<"/t" <<gi <<"/t" <<gj <<endl;

    system("pause");
    exit(0);
}

 

分别测试有copy constructor和没有的情况,结果仍然和以前一致,虽然速度很快,但是,有copy constructor的时候速度还是要慢一些,这点很让人不解,更让人不解的是,既然没有开启NRV,那么应该会有1次default constructor的调用用来构建临时变量,然后再有一次copy constructor来返回值,但是实际上gj显示default constructor和copy constructor中只有一个被调用了。说明起码是进行了某种优化了。

难道MS用的是另外一个不同于NRV的优化方案?

于是我还是从汇编来看,再怎么优化它逃不过我的眼睛:)

00401337  xor         esi,esi
00401339  fstp        qword ptr [esp+38h]
0040133D  add         dword ptr [gj (403024h)],989680h
00401347  mov         dword ptr [esp+30h],esi
0040134B  jmp         main+60h (401350h)
0040134D  lea         ecx,[ecx]

00401350  fild        dword ptr [esp+30h]
00401354  call        _ftol2_sse (401BE0h)
00401359  add         esi,1
0040135C  cmp         esi,989680h
00401362  mov         dword ptr [gi (403020h)],eax
00401367  mov         dword ptr [esp+30h],esi
0040136B  jl          main+60h (401350h)

Have you seen it?红色部分,当我第一次看到989680h的时候,它的值已经是一千万了,说白了就是MS将原来的废循环中的唯一一条不废的语句抽出来,然后在编译期就算好了这条不废语句应该有的值,然后运行时仅仅进行了一条赋值操作。而且绝的是,编译期的这个值的计算是按NRV优化后的流程进行的,即gj为1千万。。。。。。优化成这样,我不知道该怎么说了。。。。。根本就不会有任何的构造函数和拷贝构造函数的调用。

然后我将copy constructor注释掉,再次编译运行,最最让人惊讶的事情发生了,汇编代码完全一样。。。。。不是我眼睛不好使,我用BC对比后结果也是一样的。天哪,这还算优化吗?。。。。简直是恶意篡改代码……..呵呵,说严重了。问题是。。。最大的问题是,无论我测多少次,一样的汇编代码,在有copy constructor的版本总会慢一些,数量级在0.0001上,我也曾怀疑可能是偶尔的机器性能波动,但是实际多次测试,有copy constructor的版本就是会慢一些,希望有人能给我解答这个问题。

 

write by** 九天雁翎** (JTianLing) –
blog.csdn.net/vagrxie

分类:  C++ 
标签:  C++  NRV  《Inside C++ Object 》 

By 九天雁翎

2008年12月09日 | 九天雁翎的博客

前一篇: 漫谈C++中的宏 后一篇: 《Inside C++ Object 》 阅读笔记(2),看《Inside C++ Object 》的作用