硬汉嵌入式论坛

 找回密码
 立即注册
查看: 300|回复: 0
收起左侧

[辅助工具] 从零开始编写一个优化张量编译器

[复制链接]

1万

主题

7万

回帖

12万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
121120
QQ
发表于 2026-2-3 00:55:26 | 显示全部楼层 |阅读模式
https://github.com/MichaelMoroz/TensorFrost

张量编译器是一个将高级的、数学形式的张量计算(比如你在PyTorch或TensorFlow中写的代码),自动转换成在特定硬件(如CPU、GPU、AI芯片)上能高效执行的底层机器代码的软件系统

这个基于Python的前端实现了类似NumPy的低层级运算,目前开发仍在进行中。至于为什么要开发又一个张量库,主要原因是:现有的库大多严重聚焦于机器学习任务,在其他场景下扩展性不佳;动态控制流难以实现;以及通常需要在CUDA等环境中编写自定义内核。

最重要的是希望使用一种高级语言,而不是纯粹的着色器代码,并且需要能实时输出图形数据。经过一番努力,并借助LLVM完成了部分功能,现在已经有了一个可运行的实现——尽管前方仍有大量工作要做。


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|Archiver|手机版|硬汉嵌入式论坛

GMT+8, 2026-2-24 07:23 , Processed in 0.044165 second(s), 24 queries .

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表