表类型介绍
TCIceberg 表是腾讯云基于 Apache Iceberg 拓展的批流一体表格式,包含原生 Apache Iceberg 的 V1/V2 表版本,并基于之上拓展了支持近实时湖仓构建能力的 Mix 版本。各版本均支持 Apache Iceberg Rest API 规范协议,可以使用 Apache Iceberg Client 读写: TCIceberg 表版本:
支持原生 Apache Iceberg V1/V2 版本,完全兼容 Apache Iceberg 语法操作。
TCIceberg 拓展 Mix 表版本,由 Base Store 与 Change Store 2张 Iceberg 表组成,支持 CDC 读取流式增量数据,提供 Merge On Read 读时合并保证数据分析场景下的数据延迟。同时 2 张表均可直接通过 Apache Iceberg Client 读写。
表数据管理:TCIceberg 表数据由 TCLake 托管管理,包括元数据和数据文件,用户无需关注底层存储系统。删除表时,元数据和数据会被一起删除。
数据优化:由 TCLake 托管数据优化服务,包括小文件合并、过期快照清理、孤立文件清理等。
新建数据表
2. 在数据目录列表页面,选择 LakeHouse 类型数据目录,单击数据目录名称,进入数据目录详情页。
3. 在 Schema 列表中,单击 Schema 名称,进入表列表页。
4. 在表列表中,单击创建表。
5. 配置以下信息,单击确定。
配置项 | 说明 |
表名称 | 必填,同一个数据目录下不可重名。不允许以数字开头,最长为64个字符,支持大小写字母、数字、_。 |
表格式 | 选择 TCIceberg 格式。 |
表版本 | 必填,V1/V2为 Iceberg 社区原生版本,Mix 版本为腾讯云基于 Iceberg 拓展批流一体格式,适用于近实时湖仓场景。 |
表描述 | 可选,输入表描述。 |
字段信息 | 定义表中的字段信息,包括字段名称、字段类型、数据类型、是否为主键、描述信息等。 |
分区字段 | 默认不开启,开启后可定义表中的分区字段,转换策略等。 |
自定义属性 | |
查看数据表
1. 进入 LakeHouse Catalog,在 Schema 列表中,单击 Schema 名称,可查看表列表。
2. 在表列表中,单击表名称,可查看表字段、分区字段、属性。
3. 单击数据优化页签,可为 TCIceberg 表单独设置数据优化策略。
4. 单击版本历史页签,可查看 TCIceberg 表快照版本历史。
删除数据表
注意:
TCIceberg 表删除后,托管的数据将默认保留 7 天,7 天后自动删除,请谨慎操作。
1. 在 Schema 列表中,单击 Schema 名称,查看表列表。
2. 在表列表中,单击操作列的删除。
3. 在弹出的提示框中,单击确定,完成数据表删除。