Vitis BLAS 库

配置

AMD Vitis™ BLAS 库提供：

标准基本线性代数子例程 (BLAS) 的快速 FPGA 加速实现
用 C、C++ 和 Python 编写的高层次软件接口，无需任何额外的硬件配置，即可轻松使用
用 HLS 编写的低层次硬件接口，可实现更大的灵活性和控制能力

矩阵运算函数：

一般矩阵乘法

矢量运算函数：

搜索矢量元素位置
累加矢量元素的大小
计算两个矢量的点积
计算矢量标量积
计算矢量的欧氏范数
交换、缩放、复制矢量

矩阵矢量运算的函数：

一般矩阵矢量乘法
一般带状矩阵矢量乘法
对称矩阵和矢量乘法
三角矩阵和矢量乘法

函数实现类型

Vitis BLAS 库提供三种类型的函数实现方案，即 L1 原语函数、L2 内核函数和 L3 软件 API 函数。FPGA 硬件开发者可利用 L1 原语函数。L2 内核函数通过整合 L1 原语函数和数据移动器构建而成，可通过 Vitis 运行时库由主机代码调用。L3 软件 API 函数提供 C、C++ 和 Python 函数接口，允许纯软件开发者将 BLAS 运算交由 AMD 平台完成，无需其他与硬件相关的配置。下表列出了一部分这三种类型的函数。请注意，Vitis BLAS 库目前不提供任何在 Versal AI Engine 上运行的函数。

Vitis BLAS 库函数	L1 原语函数
	amax、amin：搜索矢量元素位置
	asum：累加矢量元素的大小
	dot：计算两个矢量的点积
	axpy：计算矢量标量乘积并添加到矢量
	nrm2：计算矢量的欧氏范数
	swap、scal、copy：交换、缩放或复制矢量
	symv：对称矩阵和矢量乘法
	trmv：三角矩阵和矢量乘法
	L2 内核函数
	Gemm 类：一般矩阵乘法
	Gemv 类：一般矩阵矢量乘法
	L3 软件 API 函数
	xfblasCreate：初始化库并创建句柄
	xfblasFree：释放 FPGA 器件中的内存
	xfblasGetMatrix：将 FPGA 器件内存中的矩阵复制到主机
	xfblasExecute：启动内核并等待其完成
	注意：完整的 L3 软件 API 函数列表和简介可在此处找到。

如欲详细区分 L1 原语与 L2 内核函数，请参见下表。

L1 原语函数	主要为精通硬件的开发者提供，他们希望了解底层实现逻辑并进行性能优化；始终有串流接口；通常针对单个计算模块执行；主机代码无法直接调用；
L2 内核函数	主要面向了解 Vitis 运行时库 API 的主机代码开发者；始终有内存 (DDR/HBM) 接口；由 L1 原语函数与一些数据移动器模块连接而成；主机可调用；
L3 软件 API 函数	主要为纯软件工程师提供；函数参数与硬件无关；通常用于部署；主机可调用；

组织

Vitis BLAS 库提供三种类型的函数实现方案，即 L1 原语函数、L2 内核函数和 L3 软件 API 函数。FPGA 硬件开发者可利用 L1 原语函数。L2 内核函数通过整合 L1 原语函数和数据移动器构建而成，可通过 Vitis 运行时库由主机代码调用。L3 软件 API 函数提供 C、C++ 和 Python 函数接口，允许纯软件开发者将 BLAS 运算交由 AMD 平台完成，无需其他与硬件相关的配置。下表列出了一部分这三种类型的函数。请注意，Vitis BLAS 库目前不提供任何在 Versal AI Engine 上运行的函数。

对于 L1 子目录：

include/hw：基元函数的头文件
tests/hw：包括数据移动器和原语函数在内的顶层模块
tests/sw：针对调用原语函数的测试激励文件和基础设施支持

对于 L2 子目录：

include/hw：内核函数的头文件
include/sw：用于调用内核函数的主机模块
tests/hw：包含用于构建已实现的每个内核函数的 Makefile

对于 L3 子目录：

include/sw：软件 API 函数的头文件
tests/sw：包含用于测试已实现的每个软件 API 函数的 Makefile

服务器 CPU

商用系统

个人和游戏

嵌入式产品

资源

加速器

自适应加速器

DPU 加速器

以太网适配器

工作站

台式机

笔记本电脑

资源

自适应 SoC 和 FPGA

模块化系统 (SOM)

技术

开发者资源

评估板与套件

处理器工具

显卡工具和应用

自适应 SoC 和 FPGA

IP 与应用

GPU 加速器工具和应用

以太网适配器工具

概要

面向数据中心和云计算

面向边缘计算和终端

面向开发人员

行业

行业

行业

行业

Industrias

工作负载

游戏

系统

技术

资源

EPYC（霄龙）处理器

Radeon 显卡与 AMD 芯片组

FPGA 和自适应 SoC

Alveo 加速器和 Kria SOM

锐龙处理器

以太网适配器

概要

处理器

加速器

嵌入式产品

显卡

概要

资源按产品

资源按类型

关于我们的合作伙伴

AMD 全球支持

处理器与显卡

加速器

FPGA 与自适应 SoC

选择我们的零售合作伙伴

自适应和嵌入式计算

Get AMD Fan Gear

Buy Direct From AMD

Buy Direct From AMD

Buy Direct From AMD

Buy Direct From AMD

Buy Direct From AMD

AMD Vitis™ BLAS 库

配置

功能

函数实现类型

组织

在 Vitis IDE 中执行

资源

下载库

文档

了解更多

公司

新闻与活动

资源

合作伙伴

投资者