Oculus为Quest推出两款全新GPU性能开发工具
原标题:Oculus为Quest推出两款全新GPU性能开发工具
来源:映维网 作者 黄颜
Oculus和高通在过去一年中一直在努力构建一个名为Performance Interface Library(PIL)的底层设备端库,从而提供以前只能通过Snapdragon Profiler获得的GPU信息。这个库现在已经嵌入到Quest操作系统中,并提供了两种主要的信息:渲染阶段度量和实时度量。你可以通过GPU Systrace和ovrgpuprofiler这两个新工具进行访问,以最少的GPU开销来探其所为。
1. GPU Systrace
对于大多数现有的GPU工具,一个核心问题是它们将时间测量作为绘制调用序列,而移动GPU将一个接一个地渲染曲面图元。你无法查询图片时间和信息,因为图元是在图形API之下抽象出来。然而,PIL为我们提供了一种查询所有相关数据的方法,能够有效地告诉我们“GPU渲染了一个1216×1344的曲面,其中96个图元的大小都是192×168,耗时5.2ms。”
GPU Systrace将渲染阶段信息集成到Systrace中,从而提供了更佳的可视化体验,并允许你在同一视图中查看GPU负载和CPU负载。通过这样的方式,你就可以探知应用程序的CPU负载和GPU负载是如何协同工作。
VrCubeworld 示例规矩输出(须用Chrome浏览器)
在上面的屏幕截图中,你可以在顶行看到GPU渲染曲面的进程,而CPU进程则在底行呈现。在GPU完成渲染曲面后不久,CPU等待操作(FenceChecker::wait)就会释放。另外,GPU曲面渲染过程会划分为一系列的渲染阶段。Binning是指计算所有绘制调用的三角形顶点位置并将其分配给对应于绘制曲面分区的bin。Render表示一个bin的所有顶点和片段操作的总成本。Preempt是合成器,一个操作系统级的服务,它定期执行并将应用程序提交的图像显示在屏幕。有关工具提供的GPU信息的完整列表,请参阅这个GPU Systrace文档。
2. Ovrgpuprofiler Tool
Ovrgpuprofiler是Oculus Quest的一个底层CLI工具,主要用于提供对详细GPU信息的访问。它构建成一个超轻量级的CLI客户端,并有效地充当PIL-Qualcomm库之上的wrapper。它允许你检索两种类型的信息,渲染阶段度量(类似GPU systrace,但只是文本形式)和实时度量。它的主要目标是成为一个易于使用的低摩擦工具,因为它可以直接通过adb shell提供。
在adb shell提示符中,ovrgpuprofiler-m将显示工具支持的所有实时指数列表,前几个结果是:
monterey:/ # ovrgpuprofiler -m
47 metrics supported:
1 Clocks / Second
2 GPU % Bus Busy
3 % Vertex Fetch Stall
4 % Texture Fetch Stall
5 L1 Texture Cache Miss Per Pixel
例如,如果用户希望要检索度量值3和5,用户需要调用ovrgpuprofiler–realtime=“3,5”,它将每秒返回采样的度量值:
monterey:/ # ovrgpuprofiler –realtime=”3,5”
% Vertex Fetch Stall : 1.057
L1 Texture Cache Miss Per Pixel : 0.166
% Vertex Fetch Stall : 1.082
L1 Texture Cache Miss Per Pixel : 0.166
要查询renderstage数据,在调用ovrgpuprofiler-e并重启应用(这是将应用的GPU情景置于分析模式所必需的动作,与GPU Systrace完全相同)之后,对ovrgpuprofiler-t的调用将返回如下信息:
Surface 1 | 1216×1344 | color 32bit, depth 24bit, stencil 0 bit, MSAA 4 | 60 128×224 bins | 5.12 ms | 123 stages : Binning : 0.643ms Render : 2.17ms StoreColor : 0.474ms Blit : 0.002ms Preempt : 1.411ms
渲染阶段数据允许我们回答这样的问题:“我的应用实际需要多长时间完成计算,其中有多少是时间扭曲?”
我们从数据中可以看到,它需要5.12毫秒来执行,其中1.411毫秒是时间扭曲。现在,你已经拥有了为应用做出明智选择所需的一切信息。
3. 总结
有关PIL、ovrgpuprofiler和GPU Systrace的更多信息,请查看GPU Systrace文档 和ovrgpuprofiler文档 。
需要注意的是,这个库和附带工具正在开发之中,而Oculus计划在不久的将来添加更多的信息和功能,如绘制调用度量和其他渲染阶段。Oculus同时注意到Vulkan的一个问题:在使用渲染阶段跟踪时会造成不必要的CPU等待。
相关文章
-
唱好“先分期后开卡”的信用卡新模式是妄想狂欢
-
苹果将推高端三摄iPhone 二代XR升级双摄
-
2021至2025年全球娱乐及媒体行业展望
-
中国iPhone降价说明苹果定价会收敛?网友:想多了
-
格力被中移动“取消中标资格”回应有点避重就轻
-
三星GalaxyBookPro2系列笔记本明天开启预定
-
ThoughtWorks中国的社会使命
-
【科创之声】“挖矿”是落后工艺不是高科技
-
黄仁勋:英伟达豪赌GPU终获回报,但我更看好高性能计算
-
微信“对方正在输入…...”背后,有一段互联网秘史
-
氪星晚报|京东、百度因疫情推迟香港上市计划;清华、北大上线抖音直播课;任天堂因疫情推迟Switch生产发货
-
小米9售价2999元起,李国庆离开当当,美团否认将合并大众点评
-
男子十年内被雷劈中三次,最后瘫痪而死,死后四年,坟墓也被雷劈
-
线下手机销量榜:小米9首登畅销榜前十荣耀8X大跌48.6%
-
别看华为现在风光无限 6年前余承东承受近乎绝望的压力
-
电动汽车终将完成逆袭 主宰未来市场
-
华为迅速占领苹果失地在华手机市占率飙升
-
阿里2400万股入B站,二次元淘宝大举开张?
-
从广告语冒用到商业毁谤,对「不正当竞争」说不
-
中科院院士郑建华:大数据安全仍处于积极研究,但不成熟的阶段
-
京东宣布 10 亿美元股票回购计划
-
微信更新热搜第一!朋友圈可发20图,还能直接开淘宝链接
-
哈啰趁滴滴顺风车下线疯狂圈地叫车成功率不高安全也一般
-
赋能5G产业让成都高新企业“加速跑”
-
闷声发大财:微软市值超苹果,Office 365 和智能云业务功不可没
-
阿里入股美年健康,意在健康,实则补流量短板
-
百度高管解读三季度财报:知识产品已积累数十亿条内容
-
东航客机坠毁事故第5天:八大关注焦点得到回应
-
神舟电脑大战京东的背后,中小企业的电商之路如何破局?