3.4 数据脱敏系统
3.4.1 数据脱敏系统总体架构
工业数据脱敏系统通过采集SCADA、PLC、DCS、ERP等系统,以及工业主机、数据库等软硬件设备的数据,经过数据清洗、转换等预处理过程,利用敏感数据识别与数据脱敏引擎实现对敏感数据的深度分析和脱敏处理。该系统通过设置脱敏算法选择和脱敏任务执行子模块,可以实现灵活配置的目的。无论是针对已有还是新上的工业数据脱敏业务,该系统都能提供一套合适的数据脱敏方案。
3.4.2 数据脱敏系统功能
数据脱敏系统功能包括敏感数据梳理、敏感数据识别、脱敏算法选择、脱敏任务执行及安全管理5个模块功能,如图4所示。

(1)敏感数据梳理
数据脱敏系统应内置完善的敏感数据特征库,支持包括
Oracle、SQL Server、MySQL、Informix、PostgreSQL、DB2、Sybase、EDB等主流数据库、TimescaleDB、KairosDB等时序数据库的接入,并可支持自定义数据库类型。
(2)敏感数据识别
数据脱敏系统应支持敏感数据的自动发现和识别,并且应配置多种识别策略。
(3)脱敏算法选择
数据脱敏系统应支持多种脱敏算法并应具备完善的脱敏规则,以实现对不同业务系统、不同数据库的脱敏操作。数据脱敏系统应设置专门的脱敏算法管理模块,内置包括数据替换、泛化、有损、混洗等常用的数据脱敏算法,基于机器学习、神经网络等方法的智能化脱敏算法,以及自定义脱敏算法,便于新业务应用或系统升级。此外,数据脱敏系统还应具备相对独立的脱敏规则管理模块,包括可恢复性规则和不可恢复性规则等。
(4)脱敏任务执行
数据脱敏系统应具备完善的任务调度功能,包括状态监控、调试配置、参数管理、进度执行、时间调用、命令行调用等。
(5)安全管理
数据脱敏系统应具备完善的安全管理模块,包括系统安全管理、用户权限管理和安全审计等。
4 结语
工业数据脱敏技术是数据脱敏与制造业相结合的技术产物,是工业企业、平台企业等保护工业数据安全的重要技术手段。工业数据不仅包含工业生产图纸、机理模型文件、指令代码等,还包括大量的时序数据。如何面向工业时序数据进行脱敏处理成为工业数据脱敏技术须解决的难题。期待在不远的将来,工业数据脱敏技术在现有工业数据脱敏方案的基础上,可实现针对性更强、扩展性更好的功能。
(原载于《保密科学技术》2021年4月刊)