V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
faller
V2EX  ?  问与答

深度学习 1660s AMP 加速问题

  •  
  •   faller · 2021-04-20 22:16:27 +08:00 · 707 次点击
    这是一个创建于 1119 天前的主题,其中的信息可能已经有所发展或是发生改变。

    腾讯云最新优惠活动来了:云产品限时1折,云服务器低至88元/年 ,点击这里立即抢购:9i0i.cn/qcloud,更有2860元代金券免费领取,付款直接抵现金用,点击这里立即领取:9i0i.cn/qcloudquan

    (福利推荐:你还在原价购买阿里云服务器?现在阿里云0.8折限时抢购活动来啦!4核8G企业云服务器仅2998元/3年,立即抢购>>>:9i0i.cn/aliyun

    使用 apex amp 后内存占用下降,但时间是原来的 5 倍, 前 5 耗时如下,切换 O1 O2 会导致其发生变化, 应该?换卡?!

    ncalls tottime percall cumtime percall filename:lineno(function)
    82 342.244 4.174 342.244 4.174 {method 'item' of 'torch._C._TensorBase' objects}
    91411 65.138 0.001 65.138 0.001 {method 'decode' of 'ImagingDecoder' objects}
    1280 8.153 0.006 8.153 0.006 {imread}
    80 1.464 0.018 1.464 0.018 {method 'run_backward' of 'torch._C._EngineBase' objects}
    1280 0.654 0.001 0.654 0.001 {built-in method PIL._imaging.new}
    目前尚无回复
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1108 人在线   最高记录 6547   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 22:45 · PVG 06:45 · LAX 15:45 · JFK 18:45
    Developed with CodeLauncher
    ? Do have faith in what you're doing.


    http://www.vxiaotou.com