ETL工具-Kettle的安装、使用(示例)

详解kettle工具的安装和使用首先需要安装Java开发工具包(JDK)。
您可以访问Oracle官方网站获取最新版本的JDK。
确保安装完成,以便水壶能够正常运行。
然后访问sourceforgekettle官方网站下载页面获取kettle安装包。
解压后记得将解压目录设置为kettle安装路径。
要安装MySQL驱动程序,请首先从dev.mysql.com下载页面获取最新版本的MySQLConnector/Java驱动程序。
下载后解压,将mysql-connector-java-8.0.28.jar文件复制到kettle安装目录下的lib文件夹中。
这样,kettle就可以通过这个驱动连接MySQL数据库了。
启动kettle有两种方式:对于Mac用户,可以在安装目录下执行shspoon.sh命令打开图形界面。
对于Linux用户,可以将文件传输到Linux环境,然后在数据集成目录下执行命令./pan.sh-file/home/dev/Kettle/files/lcstest-Produce.ktr运行相应的转换文件。
创建资源库,通过主界面左上角的连接功能选择RepositoryManage,添加数据库存储库和文件存储库。
数据库仓库将文件存放在创建的数据库仓库中,文件仓库将文件存放在指定的磁盘位置。
选择OtherRepositories后,您可以根据需要添加对应的数据库存储库或文件存储库,并按照数据库连接配置步骤配置连接信息,包括数据库地址和密码。
要连接数据库,请使用CoreObjectInput中的表输入组件来配置MySQL连接。
双击或右键编辑步骤时,填写表单输入步骤名称并配置数据库连接信息。
在表输入中,可以编辑SQL语句来提取特定数据。
表输出还使用表输入组件来配置数据库连接。
为了演示Kettle的使用,以MySQL->transform->kafka流程为例:从MySQL中提取数据作为起点,使用连续步骤add添加必要的信息,然后使用JavaScript脚本处理数据,比如将字段拼接成字符串JSON字符,通过字段选择步骤过滤要发送到kafka的数据,然后配置kafka生产者发送数据。
完成数据传输后,您可以通过工具栏运行它来查看转换结果。
另一方面流程,从kafka->transform->MySQL,先配置kafkaconsumer从kafka获取数据,然后使用字段选择步骤过滤主字段,将JSON格式数据解析成可以通过JSONinput组件并使用表Output组件将处理后的数据写入MySQL数据库。
完成数据回流操作。

mysql-8.0.28-winx64.zip配置步骤

MySQL8.0.28的配置过程包括以下关键步骤。
首先,从官网下载MySQL8.0.28的.msi和.zip包。
.msi是安装包,安装方便,而.zip是免安装压缩包,需要手动配置。
然后解压.zip包,新建my.ini文件并配置MySQL参数,如端口、最大连接数、允许的失败连接数、服务器使用的字符集、默认存储引擎和身份验证插件-i。
然后以管理员身份打开DOS窗口,有以下两种方法:首先,打开C:\Windows\System32\cmd.exe并以管理员身份运行,然后单击“开始”按钮,搜索“cmd”。
右键单击并选择以管理员身份运行。
然后切换到MySQL安装路径下的bin文件夹,运行命令“mysqld--initialize--console该命令会自动生成随机密码并创建一个data文件夹,生成的密码可以显示在错误文件中。
然后安装通过命令“mysqld--install”删除MySQL服务,使用“scdeletemysql”命令安装服务后,使用“netstartmysql”命令。
“netstopmysql”停止服务最后一步是根据默认生成的密码更改MySQLroot用户密码,完成整个配置过程。