Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN计算内核,并能够在现代 GPU硬件上以最大吞吐量运行。
更多 Triton 中文文档可访问 →triton.hyper.ai/
triton.language.make_block_ptr(base: tensor, shape, strides, offsets, block_shape, order)
返回指向父张量中 1 个块的指针。
参数:
- base – 父张量的基础指针。
- shape – 父张量的形状。
- strides – 父张量的步幅。
- offsets – 块的偏移量。
- block_shape – 块的形状。
- order – 原始数据格式的顺序。
IT极限技术分享汇