欢迎光临
我们一直在努力

【Triton 教程】triton_language.make_block_ptr

Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN计算内核,并能够在现代 GPU硬件上以最大吞吐量运行。

更多 Triton 中文文档可访问 →triton.hyper.ai/

triton.language.make_block_ptr(base: tensor, shape, strides, offsets, block_shape, order)

返回指向父张量中 1 个块的指针。

参数

  • base – 父张量的基础指针。
  • shape – 父张量的形状。
  • strides – 父张量的步幅。
  • offsets – 块的偏移量。
  • block_shape – 块的形状。
  • order – 原始数据格式的顺序。

https://segmentfault.com/a/1190000047512510

未经允许不得转载:IT极限技术分享汇 » 【Triton 教程】triton_language.make_block_ptr

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址