tapdata cloud使用体验

前言

tapdata从2021年下半年也开始做cloud并且开放免费社区。今天简单试用点评下。

注册与安装agent

官网微信扫码即可自动注册登入,十分便捷。同时提供了三种安装方式也能够适用于不同的OS。
image.png

首页引导

首页提供步骤引导和公告信息,方便初次使用的用户快速上手。
image.png

创建agent

点击部署,自动启docker后agent状态就会变成运行中,总体还是比较方便的。
image.png

创建连接确定订阅的库和表

添加数据源做了个类型划分还是比较合理的,把即将上线的类型放出来,可以起到吸引流量的目的。
image.png
表的订阅能力基于表达式做的,没有让用户基于meta信息去选择,这个易用性稍微差些。连接中设置表订阅主要是让用户定义了需要订阅的表的白名单。具体创建复制任务的时候可以筛选要具体订阅白名单中哪些表。

image.png

另外一个缺点是不支持多库订阅:用户要订阅很多的库的话,则需要创建非常多的连接。实际用户场景下,订阅几百个库是完全有可能的。这边如果有批量创建多库连接的能力会好点。

创建复制任务

基本能力

创建连接采用拖拽式的编排,核心功能主要是:

  • 表裁剪映射:订阅哪些库和表是创建连接时就定义的,编辑复制任务的时候只可以做映射和裁剪。可以映射已经存在的表(需要同构,否则会报错找不到列)或者裁剪掉不需要订阅的白名单中的表。
  • 表结构迁移:不存在的表结构可以自动创建,不过产品侧没有UI清晰展示自动创建结构的表不太合理。有默认类型映射也可以自定义列类型。结构迁移支持用户自定义新的列名和类型是一个不错的优点。
  • 列裁剪映射:支持列裁剪,不支持列映射。
  • 映射对端已存在的表,其中不存在的列无法自动创建:这个前置预检做的不是很好,这种不支持的点都是我试出来的,运行后才报错:

image.png

  • JS自定义处理
  • 全量、增量
  • DDL实时同步:支持具体哪些DDL操作罗列出来了,这个比较细致

image.png

所有处理节点可以编辑,编辑完毕后点击保存会联动元数据信息更新节点配置。不过实际使用中有时候貌似有BUG,关联的节点点击保存后并没有马上联动刷新,可能是异步更新的原因。
image.png

对端写入策略

基本的写入策略在对端会暴露给用户自己选择
image.png

启动任务

运行中的任务整体详情会展示出来。
image.png

数据开发

针对常见的自定义处理例如合表、条件过滤、列处理都提供了产品化的自定义处理。
image.png

总结

tapdata初步试用下来,从新用户首次轻度使用来说,总体使用体验还是比较流畅的(虽然也遇到了一些BUG)。数据复制和数据开发的编排能力在处理一些数据加工的场景对用户来说还是会比较方便。

不过一个数据集成产品是否真的足够优秀不是仅仅靠这样简单使用就能确定的了。一款优秀的数据集成产品在应对长周期的实时同步以及处理各种异构数据源迁移同步的corner case的能力才是其核心竞争力。