Kettle实战系列之Carte集群搭建实例

发布网友

共1个回答

热心网友

本文由以数据之名分享，主要阐述如何搭建Carte集群，并详细说明远程执行与集群执行的具体操作，最后简要阐述集群的主从架构机制。

在搭建Carte集群时，配置jetty容器是关键步骤之一。需要在KETTLE_HOME\data-integration\pwd下建立配置文件，包括修改三个xml文件内容。配置文件主要分为：master为主服务的配置文件（Carte-config-master-8088.xml），以及四个子服务的配置文件（Carte-config-8081.xml、Carte-config-8082.xml、Carte-config-8083.xml、Carte-config-8084.xml）。

启动jetty容器时，通过在Kettle的data-integration路径下使用carte.bat脚本依次启动五个Carte服务容器。启动命令为：Carte.bat 127.0.0.1 8088，依此类推，直至启动所有容器。

在spoon环境下配置子服务时，首先配置主服务（M-C8088），勾选“是主服务器”，然后配置从服务（S-C8081至S-C8084），不勾选“是主服务器”。完成配置后，即可在spoon环境下进行集群子服务的开发。

集群子服务开发完成后，转换步骤上选择集群即可实现集群执行。执行时，可以选择远程执行或集群执行。在远程执行中，执行时选择远程执行，并选择远程机器；在集群执行中，执行时选择集群执行，由主服务器（Master）和多个从属服务器（Slave）采用动态抢占式机制执行任务。

使用kettle集群时，定义Cluster schema至关重要。Cluster schema是一系列子服务器的集合，包括主服务器（Master）和从属服务器（Slave）。主服务器接收作业或转换任务，然后通过动态抢占式机制分配给多个从属服务器执行。

子服务器允许远程执行转换，需要在远程服务器上建立名为“Carte”的web服务器，该服务器可以接收来自spoon或转换任务的输入。

搭建Carte集群后，可实现转换的远程执行与集群执行，提高数据处理效率。此外，文章还提及了与kettle集成的其他插件开发，如Splunk、Elasticsearch、Kafka等，以及基于kettle快速构建基础数据仓库平台的实践。

欢迎读者投稿原创文章，共享知识，共同进步。

全部栏目

Kettle实战系列之Carte集群搭建实例