Skip to content

Latest commit

 

History

History
71 lines (52 loc) · 3.1 KB

README.md

File metadata and controls

71 lines (52 loc) · 3.1 KB

FastTokenizer C++ 库使用教程

1. 快速安装

当前版本 FastTokenizer C++ 库支持不同的操作系统以及硬件平台,并为以下平台提供预编译包:

系统 下载地址
Linux-x64 fast_tokenizer-linux-x64-1.0.2.tgz
Linux-aarch64 fast_tokenizer-linux-aarch64-1.0.2.tgz
Windows fast_tokenizer-win-x64-1.0.2.zip
MacOS-x64 fast_tokenizer-osx-x86_64-1.0.2.tgz
MacOS-arm64 fast_tokenizer-osx-arm64-1.0.2.tgz
Android-arm64-v8a fast_tokenizer-android-arm64-v8a-1.0.2.tgz
Android-armeabi-v7a fast_tokenizer-android-armeabi-v7a-1.0.2.tgz
Android-lite-arm64-v8a fast_tokenizer-lite-android-arm64-v8a-1.0.2.tgz
Android-lite-armeabi-v7a fast_tokenizer-lite-android-armeabi-v7a-1.0.2.tgz

环境依赖

系统环境要求

系统 版本 架构
Linux Ubuntu 16.04+,CentOS 7+ x64, aarch64
Windows 10+ x64
MacOS 11.4+ x64, arm64
Android - arm64-v8a, armeabi-v7a

Linux,Mac 编译环境要求

依赖 版本
cmake >=16.0
gcc >=8.2.0

Windows 编译环境要求

依赖 版本
cmake >=16.0
VisualStudio 2019

下载解压

wget -c https://bj.bcebos.com/paddlenlp/fast_tokenizer/fast_tokenizer-linux-x64-1.0.2.tgz

tar xvfz fast_tokenizer-linux-x64-1.0.2.tgz
# 解压后为fast_tokenizer目录

解压后得到fast_tokenizer目录,该目录的结构如下:

fast_tokenizer
|__ commit.log              # 编译时的commit id
|__ FastTokenizer.cmake     # FastTokenizer CMake文件,定义了头文件目录、动态链接库目录变量
|__ include                 # FastTokenizer的头文件目录
|__ lib                     # FastTokenizer的动态链接库目录
|__ third_party             # FastTokenizer依赖的第三方库目录

推荐用户直接使用 cmake 方式引入 FastTokenizer 库。在 CMake 引入 FastTokenizer 时,只需添加一行 include(FastTokenizer.cmake),即可获取 FastTokenizer 的预定义的 CMake 变量 FAST_TOKENIZER_INCSFAST_TOKENIZER_LIBS,分别指定 FastTokenizer 的头文件目录以及动态链接库目录。

2. 快速开始

目前 FastTokenizer 提供了以下 C++ 使用示例。

ErnieFastTokenizer C++示例

ClipFastTokenizer C++示例