跳到主要内容
版本:Next

替换

替换转换插件

描述

检查给定字段中的字符串值,并用给定的替换项替换与给定字符串字面量或正则表达式匹配的字符串值的子字符串。

属性

名称类型是否必须默认值
replace_fieldstringyes
patternstringyes-
replacementstringyes-
is_regexbooleannofalse
replace_firstbooleannofalse

replace_field [string]

需要替换的字段

pattern [string]

将被替换的旧字符串

replacement [string]

用于替换的新字符串

is_regex [boolean]

使用正则表达式进行字符串匹配

replace_first [boolean]

是否替换第一个匹配字符串。仅在 is_regex = true 时使用。

common options [string]

转换插件的常见参数, 请参考 Transform Plugin 了解详情

示例

源端数据读取的表格如下:

nameagecard
Joy Ding20123
May Ding20123
Kin Dom20123
Joy Dom20123

我们想要将 name 字段中的字符 `替换为 _。然后我们可以添加一个 Replace` 转换,像这样:

transform {
Replace {
source_table_name = "fake"
result_table_name = "fake1"
replace_field = "name"
pattern = " "
replacement = "_"
is_regex = true
}
}

那么结果表 fake1 中的数据将会更新为:

nameagecard
Joy_Ding20123
May_Ding20123
Kin_Dom20123
Joy_Dom20123

作业配置示例

env {
job.mode = "BATCH"
}

source {
FakeSource {
result_table_name = "fake"
row.num = 100
schema = {
fields {
id = "int"
name = "string"
}
}
}
}

transform {
Replace {
source_table_name = "fake"
result_table_name = "fake1"
replace_field = "name"
pattern = ".+"
replacement = "b"
is_regex = true
}
}

sink {
Console {
source_table_name = "fake1"
}
}

更新日志

新版本

  • 添加替换转换连接器