Kettle 入门
🏷️ Kettle
安装 Kettel
下载 Kettle 并运行 Spoon
从 这里 下载 Kettle ,下载后解压并运行 data-integration 目录下的 Spoon.bat 就可以启动了。
新建 Repository(仓库)连接
这里是设置保存 Kettle 数据(用户、转换、作业 等)的仓库的连接的。
在 Spoon 中创建 SqlServer 的数据库连接时报如下错误。
Driver class 'net.sourceforge.jtds.jdbc.Driver' could not be found, make sure the 'MS SQL Server' driver (jar file) is installed.
net.sourceforge.jtds.jdbc.Driver这个是由于缺少 jtds 的 jar 包导致的。从 这里 下载后放到 lib 目录下,再次启动 Spoon 就可以了。
之后登录时又报这个错误,后来发现是由于数据库账户缺少建表的权限导致的。
You don't seem to be getting a connection to the server. Please check the path you're using and make sure the server is up and running.
登录 Kettle
默认的登录账户名和密码都是 admin 。首次登录时会创建 R_ 为前缀的一系列表。
之后可以在 工具 => 资源库 => 探索资源库 的 安全 标签中管理用户。
创建 ETL 任务
1. 创建 转换
右键 主对象树 的 DB 连接 ,选择 新建 来新增数据库连接。一般新增 一个数据源的连接 和 一个目标源的连接。
切换到 核心对象 标签 将 输入 => 表输入 、 输出 => 表输出 、 转换 => 字段转换 拖拽到右侧的编辑区。
按住
Shift
拖拽 表输入 到 字段转换,按住Shift
拖拽 字段转换 到 表输出。按住
Shift
拖拽。按住Shift
拖拽。按住Shift
拖拽。
重要的事情说三遍。之前我在界面上找了半天没有找到创建节点连接的按钮。分别双击上面的三个步骤,编辑详细设置。
编辑完成后,通过点击编辑区左上角的 运行这个转换 来执行。
运行前必须先保存。首次保存时会弹出 转换属性 的设置界面,也可以在 主对象树 标签中通过右键 转换 选择 设置 来打开这个界面。
2. 创建 作业
切换 核心对象 标签,双击 通用 目录下的 START 和 转换。此时会自动创建 START 和 转换 之间的节点连接(也可以手动拖动来创建节点连接)。
可以在 START 中设置任务重复执行的时间间隔等。
双击 转换 ,点击 浏览 按钮来选择已经保存的转换。
点击编辑区左上角的 Run 按钮来运行这个作业。