优化 QEMU RISC-V 向量跨步 LD/ST 指令,让相关指令的模拟性能提升 25 倍
这两天逛邮件列表,发现有一个 QEMU TCG RVV 指令的性能优化补丁(Re: [PATCH 1/1 v2] [RISC-V/RVV] Generate strided vector loads/stores with tcg nodes. - Paolo Savini) 被 revert 了,原因是存在正确性问题。
昨晚来了兴致,于是我把这个补丁给修好了,已经提交新的版本到上游: [PATCH v4 0/2] target/riscv: Generate strided vector ld/st with tcg - Chao Liu。
总体来说,这个补丁的性能提升还是很可观的,毕竟原来是用 helper 实现的。
所以直播的时候顺便录个视频总结一下这个补丁优化了哪些地方。
结果录视频的时候,又发现一个可以优化的地方~哈哈,可以再水一笔提交了。
立即观看