当前版本 FastTokenizer C++ 库支持不同的操作系统以及硬件平台,并为以下平台提供预编译包:
系统 | 下载地址 |
---|---|
Linux-x64 | fast_tokenizer-linux-x64-1.0.2.tgz |
Linux-aarch64 | fast_tokenizer-linux-aarch64-1.0.2.tgz |
Windows | fast_tokenizer-win-x64-1.0.2.zip |
MacOS-x64 | fast_tokenizer-osx-x86_64-1.0.2.tgz |
MacOS-arm64 | fast_tokenizer-osx-arm64-1.0.2.tgz |
Android-arm64-v8a | fast_tokenizer-android-arm64-v8a-1.0.2.tgz |
Android-armeabi-v7a | fast_tokenizer-android-armeabi-v7a-1.0.2.tgz |
Android-lite-arm64-v8a | fast_tokenizer-lite-android-arm64-v8a-1.0.2.tgz |
Android-lite-armeabi-v7a | fast_tokenizer-lite-android-armeabi-v7a-1.0.2.tgz |
系统 | 版本 | 架构 |
---|---|---|
Linux | Ubuntu 16.04+,CentOS 7+ | x64, aarch64 |
Windows | 10+ | x64 |
MacOS | 11.4+ | x64, arm64 |
Android | - | arm64-v8a, armeabi-v7a |
依赖 | 版本 |
---|---|
cmake | >=16.0 |
gcc | >=8.2.0 |
依赖 | 版本 |
---|---|
cmake | >=16.0 |
VisualStudio | 2019 |
wget -c https://bj.bcebos.com/paddlenlp/fast_tokenizer/fast_tokenizer-linux-x64-1.0.2.tgz
tar xvfz fast_tokenizer-linux-x64-1.0.2.tgz
# 解压后为fast_tokenizer目录
解压后得到fast_tokenizer目录,该目录的结构如下:
fast_tokenizer
|__ commit.log # 编译时的commit id
|__ FastTokenizer.cmake # FastTokenizer CMake文件,定义了头文件目录、动态链接库目录变量
|__ include # FastTokenizer的头文件目录
|__ lib # FastTokenizer的动态链接库目录
|__ third_party # FastTokenizer依赖的第三方库目录
推荐用户直接使用 cmake 方式引入 FastTokenizer 库。在 CMake 引入 FastTokenizer 时,只需添加一行 include(FastTokenizer.cmake)
,即可获取 FastTokenizer 的预定义的 CMake 变量 FAST_TOKENIZER_INCS
和 FAST_TOKENIZER_LIBS
,分别指定 FastTokenizer 的头文件目录以及动态链接库目录。
目前 FastTokenizer 提供了以下 C++ 使用示例。