字节跳动安全团队开源自研敏感信息保护方案 GoDLP
近日,字节跳动安全团队对外宣布开源敏感数据保护方案 GoDLP,该方案能够应用多种隐私合规标准,对原始数据进行分级打标、判断敏感级别和实施相应的脱敏处理。
据悉,GoDLP 提供了一系列针对敏感数据的识别和处置方案,其中包括敏感数据识别算法,数据脱敏处理方式,业务自定义的配置选项和海量数据处理能力。
作为字节跳动在数据脱敏保护方向成功的实践案例,字节安全团队决定用开源的方式向大家分享其研究成果,与行业一同成长。字节跳动安全团队相关负责人表示,GoDLP 会长期维护更新,欢迎行业人士一起沟通交流。
字节跳动开源的 GoDLP 是怎么样?
GoDLP 能够广泛支持结构化(JSON 数据、KV 数据、golang map)和非结构化数据(多语言字符串)。
● 可实现敏感数据自动发现
GoDLP 内置多种敏感数据识别规则,可覆盖市面 80% 以上识别规则,最大程度识别敏感数据
● 灵活的敏感数据脱敏处理
GoDLP 支持多种脱敏算法,用户可自行根据需求进行脱敏处理
● 业务自定义配置选项
除默认的敏感信息识别和处理规则外,业务可根据实际情况,配置自定义的 YAML 规则,GoDLP 能够根据传入的配置选项,完成相应的数据处理任务。
GoDLP 的性能表现
下方数据是在开启全部敏感数据类型情况下的结果
● 针对 1K 的文件,用时需 4.1 毫秒,占用 128.6k 的内存
● 1M 的文件,用时为 4.1s,内存占用 118.6MB
(测试环境:8 核虚拟机,Linux,amd64,Intel (R) Xeon (R) Platinum8260CPU@2.40GHz;代码版本:v2.0.0)
GoDLP 在字节的实践
GoDLP 已在字节跳动进行了丰富的实践,已接入的业务线涵盖抖音、电商、飞书、火山引擎、云安全、财经、教育、游戏等诸多业务线。
2022-05-06 00:54:51