tencent cloud

腾讯云数据仓库 TCHouse-C

产品动态
产品简介
产品概述
基本概念
集群架构
产品优势
应用场景
购买指南
计费概述
到期与欠费说明
退费说明
配置变更计费说明
快速入门
操作指南
管理集群
参数配置
监控告警
冷热分层
账户与授权
查询管理
日志检索
数据字典
备份与恢复
多 Zookeeper
外部数据入仓
配置 DDL on Cluster 功能
数据重分布
缩容迁移
开发指南
数据库引擎
表引擎
ClickHouse SQL 语法参考
ClickHouse 客户端介绍
ClickHouse 自建迁移方案
服务等级协议
CDWCH 政策
隐私政策
数据隐私和安全协议
常见问题
联系我们
词汇表

HDFS 数据导入

PDF
聚焦模式
字号
最后更新时间: 2025-03-31 14:55:26
本文介绍如何从 HDFS 中导入数据到腾讯云数据仓库 TCHouse-C 。

前提条件

1. 访问 HDFS 的数据需要具备对 HDFS 的读权限。如何设置权限,请参见访问控制概述。
2. 确保 HDFS 的实例和腾讯云数据仓库 TCHouse-C 集群处在相同 VPC 中。

操作步骤

1. 登录腾讯云数据仓库 TCHouse-C ,创建 HDFS 表。
CREATE TABLE hdfs_engine_table
(
`int_id` UInt32
)
ENGINE = ENGINE=HDFS('hdfs://hdfs1:9000/other_storage', 'TSV')
参考
ENGINE = HDFS(URI, format) URI 参数是 HDFS 中整个文件的 URI。 format 参数指定一种可用的文件格式,更多格式参考 输入/输出格式。 路径部分 URI 可能包含 glob 通配符。 在这种情况下,表将是只读的。
2. 创建 ClickHouse 目标表。
如果您的集群是单副本版:
CREATE TABLE test.test on cluster default_cluster
(
`int_id` UInt32
)
engine = MergeTree()
order by int_id;
如果您的集群是双副本版:
create table test.test on cluster default_cluster
(
`int_id` UInt32
)
engine = ReplicatedMergeTree('/clickhouse/tables/test/test/{shard}', '{replica}')
order by int_id;
创建分布式表:
create table test.test_dis on cluster default
AS test.test
engine = Distributed('default_cluster', 'test', 'test', rand());
3. 向目标表写入数据。
INSERT INTO test.test SELECT * FROM hdfs_engine_table;
4. 查询数据。
select * from test.test


帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈