@EastonMan 看的新闻
+碎碎念
+膜大佬
+偶尔猫猫
+伊斯通听的歌
Firefox Profiler⁩ — ⁨Firefox⁩ 性能分析网页应用程序

支持导入并分析多种性能筛查器所记录的分析数据:
- Firefox profiler
- Linux perf
- Android SimplePerf
- Chrome 性能面板
- Android Studio

支持直接导入以 dhat 或 Google Trace Event 格式保存的性能分析数据。

https://profiler.firefox.com/
最近老黄的256卡机器宣传E级算力,有几个事实希望大家了解

1. 老黄这个E级是算的INT8理论峰值性能(256x4P per card)
2. top500超算的评估性能是HPL,是FP64的实际性能,大约是理论性能的60-90%不等
3. 老黄的FP64理论峰值性能是256 x 34T = 8PFlops+
4. 目前top500上的E级超算只有美国一家,但中国也是有E级超算的,投入使用时间和美国的差不多甚至更早。(这个不信的话,SC20还是SC21有位chair的ppt可以看)

老黄这个目标市场还是有钱的ai公司,和超算的目标领域不太一样,没有太大的对比意义,无需给大家带来一种“超算怎么搞这么大规模才这点算力的”印象
Easton Man's Channel
#JamesAslan #龙芯 https://zhuanlan.zhihu.com/p/633012156
3 BrU 是否有点太夸张了?
ARM去掉了mop Cache,这个burst的供指从哪里来?
Matt Keeter
The monitoring task had failed 100 consecutive times. Your subscription to the RSS feed has been deactivated.
To reactivate it, please use the /activate_subs command.
ERROR: Network error (ClientConnectorError)
什么服务商维护,
还有这种操作,编译器真会用吗
Easton Man's Channel
Artifact 1: ISCA 2020 的回顾文章 Artifact 2: 三星的BTB专利 以前可能也发过,三星的graph-like的L0 BTB设计
优点缺点在JamesAslan的文章里都有提及
优点是设计2 taken预测甚至多taken预测较为简单
缺点是启动和误预测结束都需要多拍来重新ramp up,这个和L0 BTB本应减少延迟的初衷相悖,因此效果可能并不好
Back to Top