Skip to content

Commit

Permalink
fix: typos
Browse files Browse the repository at this point in the history
Fix typos in `DataX-write.md`, `modump.md`, `create-secondary-index.md` and `vector-type.md`
  • Loading branch information
3fuyang committed Dec 1, 2023
1 parent 9b0ee22 commit cd77917
Show file tree
Hide file tree
Showing 4 changed files with 17 additions and 19 deletions.
Original file line number Diff line number Diff line change
Expand Up @@ -212,15 +212,15 @@ MatrixOne 擅长 HTAP 场景的事务处理和低延迟分析计算,ElasticSea

### 环境准备

- MatrixOne版本:1.0.0
- MatrixOne 版本:1.0.0

- Elasticsearch版本:7.10.2
- Elasticsearch 版本:7.10.2

- DataX版本[DataX_v202309](https://datax-opensource.oss-cn-hangzhou.aliyuncs.com/202309/datax.tar.gz)
- DataX 版本[DataX_v202309](https://datax-opensource.oss-cn-hangzhou.aliyuncs.com/202309/datax.tar.gz)

### 在 MatrixOne 中创建库和表

创建数据库`mo`,并在该库创建数据表 person:
创建数据库 `mo`,并在该库创建数据表 person:

```sql
create database mo;
Expand Down Expand Up @@ -301,7 +301,7 @@ curl -u elastic:elastic -X GET http://127.0.0.1:9200/person/_search?pretty -H 'C

### 使用 DataX 导入数据

#### 1.下载并解压 DataX
#### 1. 下载并解压 DataX

DataX 解压后目录如下:

Expand All @@ -323,7 +323,7 @@ drwxr-xr-x. 2 root root 24 Oct 11 09:55 tmp

在进行后续的操作前,请先检查插件是否已正确分发在对应的位置中。

#### 2.编写 ElasticSearch 至 MatrixOne 的迁移作业文件
#### 2. 编写 ElasticSearch 至 MatrixOne 的迁移作业文件

DataX 使用 json 文件来配置作业信息,编写作业文件例如 **es2mo.json**,习惯性的可以将其存放在 `datax/job` 目录中:

Expand Down Expand Up @@ -408,7 +408,7 @@ DataX 使用 json 文件来配置作业信息,编写作业文件例如 **es2mo
}
```

#### 3.执行迁移任务
#### 3. 执行迁移任务

进入 datax 安装目录,执行以下命令启动迁移作业:

Expand All @@ -431,7 +431,7 @@ python bin/datax.py job/es2mo.json
读写失败总数 : 0
```

#### 4.在 MatrixOne 中查看迁移后数据
#### 4. 在 MatrixOne 中查看迁移后数据

在 MatrixOne 数据库中查看目标表中的结果,确认迁移已完成:

Expand All @@ -447,7 +447,7 @@ mysql> select * from mo.person;
3 rows in set (0.00 sec)
```
#### 5.编写 MatrixOne 至 ElasticSearch 的作业文件
#### 5. 编写 MatrixOne 至 ElasticSearch 的作业文件
编写 datax 作业文件 **mo2es.json**,同样放在 `datax/job` 目录,MatrixOne 高度兼容 MySQL 协议,我们可以直接使用 mysqlreader 来通过 jdbc 方式读取 MatrixOne 中的数据:
Expand Down Expand Up @@ -533,7 +533,7 @@ INSERT into mo.person (id, name, birthday)
VALUES(1, 'mo101', '2023-07-09'),(2, 'mo102', '2023-07-08'),(3, 'mo103', '2023-07-12');
```
#### 7.执行 MatrixOne 向 ElasticSearch 的迁移任务
#### 7. 执行 MatrixOne 向 ElasticSearch 的迁移任务
进入 datax 安装目录,执行以下命令
Expand All @@ -556,7 +556,7 @@ python bin/datax.py job/mo2es.json
读写失败总数 : 0
```
#### 8.查看执行结果
#### 8. 查看执行结果
在 Elasticsearch 中查看结果
Expand Down
6 changes: 3 additions & 3 deletions docs/MatrixOne/Develop/export-data/modump.md
Original file line number Diff line number Diff line change
Expand Up @@ -9,7 +9,7 @@ MatrixOne 支持以下两种方式导出数据:

## 什么是 mo-dump

`mo-dump` 是 MatrixOne 的一个客户端实用工具,与 `mysqldump` 一样,它可以被用于通过导出*.sql* 类型的文件来对 MatrixOne 数据库进行备份,该文件类型包含可执行以重新创建原始数据库的 SQL 语句。
`mo-dump` 是 MatrixOne 的一个客户端实用工具,与 `mysqldump` 一样,它可以被用于通过导出 `.sql` 类型的文件来对 MatrixOne 数据库进行备份,该文件类型包含可执行以重新创建原始数据库的 SQL 语句。

使用 `mo-dump` 工具,你必须能够访问运行 MatrixOne 实例的服务器。你还必须拥有导出的数据库的用户权限。

Expand All @@ -36,7 +36,7 @@ MatrixOne 支持以下两种方式导出数据:

- **-net-buffer-length [数据包大小]**:数据包大小,即 SQL 语句字符的总大小。数据包是 SQL 导出数据的基本单位,如果不设置参数,则默认 1048576 Byte(1M),最大可设置 16777216 Byte(16M)。假如这里的参数设置为 16777216 Byte(16M),那么,当要导出大于 16M 的数据时,会把数据拆分成多个 16M 的数据包,除最后一个数据包之外,其它数据包大小都为 16M。

- **-csv**:可选参数。当设置此参数时,表示导出的数据为 *CSV* 格式,并将所有的数据表的数据导出为当前目录下 *${databaseName} _${tableName}. csv*,如果参数为空,则默认以 DML 方式(INSERT 语句)导出数据。
- **-csv**:可选参数。当设置此参数时,表示导出的数据为 *CSV* 格式,并将所有的数据表的数据导出为当前目录下 `${databaseName}_${tableName}.csv`,如果参数为空,则默认以 DML 方式(INSERT 语句)导出数据。

- **--local-infile**:默认值为 true,仅在 **-csv** 参数存在时产生影响,否则无作用。具体来说此参数仅影响 modump 输出的 *importStatement.sql* 脚本中 `LOAD DATA [LOCAL] INFILE` 语句是否含有 `LOCAL`
- **--local-infile=true**:脚本中使用 `LOAD DATA LOCAL INFILE`,既适用于于本地数据导入本地 MatrixOne,也适用于本地数据导入远程 MatrixOne。
Expand Down Expand Up @@ -67,7 +67,7 @@ __Tips:__ 由于 `mo-dump` 是基于 Go 语言进行开发,所以你同时需
## 如何使用 `mo-dump` 导出 MatrixOne 数据库
`mo-dump` 在命令行中非常易用。参见以下步骤示例,导出*.sql* 文件格式完整数据库:
`mo-dump` 在命令行中非常易用。参见以下步骤示例,导出 `.sql` 文件格式完整数据库:
在你本地计算机上打开终端窗口,输入以下命令,连接到 MatrixOne,并且导出数据库:
Expand Down
Original file line number Diff line number Diff line change
Expand Up @@ -60,5 +60,3 @@ mysql> SELECT * FROM users WHERE name = 'John';
+------+------+------+----------------+
1 row in set (0.00 sec)
```


6 changes: 3 additions & 3 deletions docs/MatrixOne/Reference/Data-Types/vector-type.md
Original file line number Diff line number Diff line change
Expand Up @@ -8,7 +8,7 @@

## 什么是向量检索?

向量检索又称为近似最近邻搜索 (Approximate Nearest Neighbor Search, ANNS),是一种在大规模高维向量数据中 寻找与给定查询向量相似的向量的技术。向量检索在许多 AI 领域 具有广泛的应用,如图像检索、文本检索、语音识别、推荐系统等。向量检索与传统数据库检索有很大差别,传统数据库上的标量搜索主要针对结构化数据进行精确的数据查询,而向量搜索主要针对非结构化数据向量化之后的向量数据进行相似检索,只能近似获得最匹配的结果。
向量检索又称为近似最近邻搜索 (Approximate Nearest Neighbor Search, ANNS),是一种在大规模高维向量数据中寻找与给定查询向量相似的向量的技术。向量检索在许多 AI 领域具有广泛的应用,如图像检索、文本检索、语音识别、推荐系统等。向量检索与传统数据库检索有很大差别,传统数据库上的标量搜索主要针对结构化数据进行精确的数据查询,而向量搜索主要针对非结构化数据向量化之后的向量数据进行相似检索,只能近似获得最匹配的结果。

![vector vs scalar](https://community-shared-data-1308875761.cos.ap-beijing.myqcloud.com/artwork/docs/reference/vector/vector_vs_scalar.png)

Expand All @@ -26,7 +26,7 @@

## MatrixOne 的向量数据类型

在 MatrixOne 中,向量被设计成一种数据类型,它类似于编程语言中的 Array 数组 ( MatrixOne 目前还不支持数组类型),但是是一种较为特殊的数组类型。首先,它是一个一维数组类型,意味着它不能用来构建 Matrix 矩阵。另外目前仅支持 `float32``float64` 类型的向量,分别称之为 `vecf32``vecf64` 而不支持字符串类型和整型类型的数字。
在 MatrixOne 中,向量被设计成一种数据类型,它类似于编程语言中的 Array 数组 (MatrixOne 目前还不支持数组类型),但是是一种较为特殊的数组类型。首先,它是一个一维数组类型,意味着它不能用来构建 Matrix 矩阵。另外目前仅支持 `float32``float64` 类型的向量,分别称之为 `vecf32``vecf64` 而不支持字符串类型和整型类型的数字。

创建一个向量列时,我们可以指定向量列的维度大小,如 vecf32(3),这个维度即向量的数组的长度大小,最大可支持到 65,536 维度。

Expand Down Expand Up @@ -102,7 +102,7 @@ mysql> select encode(b, "hex") from t1;
## 支持的算子与函数

* 基本二元操作符:[`+`, `-`, `*`, `/`](../Functions-and-Operators/Vector/arithmetic.md).
* 比较操作符:`=`,`!=`, `>`, `>=` , `<`, `<=`.
* 比较操作符:`=`, `!=`, `>`, `>=`, `<`, `<=`.
* 一元函数:[`sqrt`, `abs`, `cast`](../Functions-and-Operators/Vector/misc.md).
* 自动类型转换:
* `vecf32` + `vecf64` = `vecf64`.
Expand Down

0 comments on commit cd77917

Please sign in to comment.