Skip to content

Kettle 入门

🏷️ Kettle

安装 Kettel

  1. 下载 Kettle 并运行 Spoon

    这里 下载 Kettle ,下载后解压并运行 data-integration 目录下的 Spoon.bat 就可以启动了。

  2. 新建 Repository(仓库)连接

    这里是设置保存 Kettle 数据(用户、转换作业 等)的仓库的连接的。

    Spoon 中创建 SqlServer 的数据库连接时报如下错误。

    Driver class 'net.sourceforge.jtds.jdbc.Driver' could not be found, make sure the 'MS SQL Server' driver (jar file) is installed.
    net.sourceforge.jtds.jdbc.Driver

    这个是由于缺少 jtdsjar 包导致的。从 这里 下载后放到 lib 目录下,再次启动 Spoon 就可以了。

    之后登录时又报这个错误,后来发现是由于数据库账户缺少建表的权限导致的。

    You don't seem to be getting a connection to the server. Please check the path you're using and make sure the server is up and running.

  3. 登录 Kettle

    默认的登录账户名和密码都是 admin 。首次登录时会创建 R_ 为前缀的一系列表。
    之后可以在 工具 => 资源库 => 探索资源库安全 标签中管理用户。

创建 ETL 任务

1. 创建 转换

  1. 右键 主对象树DB 连接 ,选择 新建 来新增数据库连接。一般新增 一个数据源的连接 和 一个目标源的连接。

  2. 切换到 核心对象 标签 将 输入 => 表输入输出 => 表输出转换 => 字段转换 拖拽到右侧的编辑区。

  3. 按住 Shift 拖拽 表输入字段转换,按住 Shift 拖拽 字段转换表输出

    按住 Shift 拖拽。按住 Shift 拖拽。按住 Shift 拖拽。
    重要的事情说三遍。之前我在界面上找了半天没有找到创建节点连接的按钮。

  4. 分别双击上面的三个步骤,编辑详细设置。

  5. 编辑完成后,通过点击编辑区左上角的 运行这个转换 来执行。

    运行前必须先保存。首次保存时会弹出 转换属性 的设置界面,也可以在 主对象树 标签中通过右键 转换 选择 设置 来打开这个界面。

2. 创建 作业

  1. 切换 核心对象 标签,双击 通用 目录下的 START转换。此时会自动创建 START转换 之间的节点连接(也可以手动拖动来创建节点连接)。

  2. 可以在 START 中设置任务重复执行的时间间隔等。

  3. 双击 转换 ,点击 浏览 按钮来选择已经保存的转换。

  4. 点击编辑区左上角的 Run 按钮来运行这个作业。