update

2021-11-14 15:52:46 +08:00
parent 915c231124
commit 1e344dc204
112 changed files with 1039 additions and 1039 deletions
--- a/content/post/ch-search.md
+++ b/content/post/ch-search.md
@@ -6,10 +6,10 @@ tags: []
 categories: ["clickhouse"]
 ---

-# 查询注意
+## 查询注意
 - **避免使用 SELECT * 查询**

-# WITH
+## WITH
 - **WITH 子句只能返回一行数据**
 - 定义变量
    ```sql
@@ -31,11 +31,11 @@ categories: ["clickhouse"]

 - WITH 子句可在子查询中嵌套使用

-# FROM
+## FROM
 - 支持表、表函数和子查询
 - 可用 FINAL 修饰以强制合并，会降低性能，应尽量避免使用

-# SAMPLE
+## SAMPLE
 - 返回采样数据，减少查询负载，适用于近似查询
 - 只能用于 MergeTree 系列引擎表，且声明了 SAMPLE BY 抽样表达式
 - 虚拟字段 \_sample_factor 是采样系数
@@ -63,7 +63,7 @@ categories: ["clickhouse"]
    SELECT ... SAMPLE 0.4 OFFSET 0.5
    ```

-# ARRAY JOIN
+## ARRAY JOIN
 - 允许在数据表内部，与数组或嵌套字段进行 JOIN 操作，操作时把数组或嵌套字段拆成多行
 - 支持 INNER 和 LEFT，默认 INNER
    ```sql
@@ -71,8 +71,8 @@ categories: ["clickhouse"]
    SELECT ... FROM table_name LEFT ARRAY JOIN column_name AS alias_name
    ```

-# JOIN
-## 连接精度
+## JOIN
+### 连接精度
 - ALL: 默认，左表的每行数据，在右表中有多行连接匹配，返回右表全部连接数据
 - ANY: 左表的每行数据，在右表中有多行连接匹配，返回右表第一行连接数据
 - ASOF: 增加模糊连接条件，对应字段必须是整数、浮点数和日期这类有序数据类型
@@ -81,7 +81,7 @@ categories: ["clickhouse"]
    -- key_1 字段是 join key，key_2 是模糊连接条件字段
    ```

-## 连接类型
+### 连接类型
 - INNER: 内连接，返回交集部分
 - OUTER: 外链接
    - LEFT: 左表数据全部返回，右表匹配则返回，不匹配则填充相应字段的默认值
@@ -90,7 +90,7 @@ categories: ["clickhouse"]

 - CROSS: 交叉连接，返回笛卡儿积

-## JOIN 查询优化
+### JOIN 查询优化
 - 左大右小，小表放右侧，右表会被加载到内存中
 - JOIN 查询无缓存，应用可考虑实现查询缓存
 - 大量维度属性补全时，建议使用字典表代替 JOIN 查询
@@ -99,7 +99,7 @@ categories: ["clickhouse"]
    SELECT ... FROM table_1 INNTER JOIN table_2 USING key_1
    ```

-# PREWHERE
+## PREWHERE
 - 只能用于 MergeTree 系列表引擎
 - 与 WHERE 不同之处:
    - 只读取 PREWHERE 指定的列字段，条件过滤
@@ -107,7 +107,7 @@ categories: ["clickhouse"]

 - clickhouse 会在合适条件下自动把 WHERE 替换成 PREWHERE

-# GROUP BY
+## GROUP BY
 - WITH ROLLUP，按聚合键从右向左上卷数据，基于聚合函数依次生成分组小计和总计
    ```sql
    SELECT table, name, SUM(bytes_on_disk) FROM system.parts
@@ -132,18 +132,18 @@ categories: ["clickhouse"]
        ...
    ```

-# HAVING
+## HAVING
 - 必须与 GROUP BY 配合使用，把聚合结果二次过滤
    ```sql
    SELECT ... GROUP BY ... HAVING ...
    ```

-# ORDER BY
+## ORDER BY
 - 默认 ASC(升序)
 - NULLS LAST，默认，其他值 -> NaN -> NULL
 - NULLS FIRST，NULL -> NaN -> 其他值

-# LIMIT BY
+## LIMIT BY
 - 返回指定分组的最多前 n 行数据
    ```sql
    LIMIT n BY key1,key2 ...
@@ -156,7 +156,7 @@ categories: ["clickhouse"]
    LIMIT m,n BY key1,key2 ...
    ```

-# LIMIT
+## LIMIT
 - 返回指定的前 n 行数据
    ```sql
    LIMIT n
@@ -166,17 +166,17 @@ categories: ["clickhouse"]

 - 推荐搭配 ORDER BY，保证全局顺序

-# SELECT
+## SELECT
 - 查询正则匹配的列字段
    ```sql
    SELECT COLUMNS('^n'), COLUMNS('p') FROM system.databases
    ```

-# DISTINCT
+## DISTINCT
 - 去重
 - 先 DISTINCT 后 ORDER BY

-# UNION ALL
+## UNION ALL
 - 联合左右两边的子查询，一并返回结果，可多次声明使用联合多组查询
    ```sql
    SELECT c1, c2 FROM t1 UNION ALL SELECT c3, c4 FROM t2
@@ -184,7 +184,7 @@ categories: ["clickhouse"]

 - 两边列字段数量必须一样，类型兼容，查询结果列名以左侧为准

-# SQL 执行计划
+## SQL 执行计划
 - 设置日志到 DEBUG 或 TRACE 级别，可查看 SQL 执行日志
 - SQL 需真正执行后才有日志，如果查询量大，推荐 LIMIT
 - **不要用 SELECT * 查询**