1-3 · 财务人 AI 基础与安全边界

财务数据脱敏规则

在能写提示词后,补上使用前提:哪些数据可以给 AI、哪些必须先处理。为后续表格、对账、税务模块做数据安全准备。

5 个关键知识点7 个讲义块6 道快练1 道任务练3 份模板可下载
返回模块页
本课产出财务数据脱敏清单

先把《财务数据脱敏清单》搭出第一版,不要只停留在看懂。

推荐学法

建议按“为什么财务数据必须先脱敏 -> 财务工作中的高敏感数据分类 -> 替换 模糊化 删除 区间化怎么选”的顺序往下看,先抓方法,再做练习和模板。

学习目标

在能写提示词后,补上使用前提:哪些数据可以给 AI、哪些必须先处理。为后续表格、对账、税务模块做数据安全准备。

  • 高敏感数据识别
  • 个人信息、银行信息、薪酬数据、合同数据、经营数据的风险等级
  • 替换、模糊化、删除、区间化等脱敏方法
先完成这三步
  • 先把《财务数据脱敏清单》搭出第一版,不要只停留在看懂。
  • 拿 1 个真实场景试跑一遍,再补成自己的版本。
  • 固定写下 4 个人工复核点,别让 AI 输出直接进入正式工作。
带着这三个问题往下看
  • 这节课里,我最容易在哪一步偷懒或漏掉复核?
  • 我会在哪个真实工作场景里复用《财务数据脱敏清单》?
  • 以后再做同类任务时,我要先检查哪 3 件事?

1 节 · 导入

为什么财务数据必须先脱敏

先建立一个底线认知 不是所有数据都能直接丢给 AI。

财务数据里最危险的不是金额大 而是身份信息 账户信息 合同信息和未公开经营数据混在一起。

你把这些原始数据直接输入 AI 看似省时间 但一旦流转范围失控 风险很难补救。

工资表里有身份证号和银行卡。

银行流水里有完整账号和交易对手。

客户合同里有价格条款和回款条件。

这些内容一旦外泄 后果可能是个人投诉 合规风险 商业机密暴露。

脱敏的目的不是把数据弄得看不懂 而是在不暴露敏感信息的前提下 仍然保留分析需要的关键字段。

真正难的不是知道要脱敏 而是知道哪些字段必须删 哪些字段可以保留部分特征 哪些字段需要换成区间。

这一节先抓住
场景

案例一:把含身份证号的工资表直接上传做薪酬分析 会把个人敏感信息一起暴露。

风险

容易出错的地方通常出在先建立一个底线认知 不是所有数据都能直接丢给 AI。

动作

以后每次想把表格交给 AI 先问自己 这张表里有没有身份证号 银行账号 合同条款 或未公开经营数据。

对照场景
相关案例 2

案例二:把客户对账单原样上传去做回款归纳 可能把完整银行账号和联系人电话一并带出去。

2 节 · 概念

财务工作中的高敏感数据分类

把高敏感 中敏感 低敏感字段分清楚。

高敏感数据通常分五类。

第一类是个人身份信息 比如身份证号 手机号 家庭住址 员工编号和银行卡号。

第二类是薪酬和人事信息 比如工资 奖金 社保基数 绩效结果。

第三类是银行和收付款信息 比如完整账号 开户行 户名和交易对手。

第四类是合同和经营条款 比如单价 折扣 返点 回款条件。

第五类是未公开经营数据 比如客户名单 毛利率 采购价和并购计划。

中敏感字段通常是岗位 部门 项目名称 这些要看用途决定是否脱敏。

低敏感字段通常是月份 产品大类 费用类别等 不直接指向个人或商业机密。

真正容易漏的是备注列 自由填写项 和文件名 这些地方经常藏着身份证号 合同编号和手机号。

这一节先抓住
场景

案例:客户对账单里的金额本身不一定要删 但完整账号和联系人电话必须先处理。

风险

容易出错的地方通常出在把高敏感 中敏感 低敏感字段分清楚。

动作

先给常见表格列一个字段清单 在旁边标注 高 中 低 三档敏感等级。

对照场景
相关案例 2

案例:工资表里的部门字段通常可保留 但姓名和身份证号一定要脱敏。

3 节 · 方法

替换 模糊化 删除 区间化怎么选

知道四种脱敏方法分别适合什么场景。

替换适合保留记录唯一性但不暴露真实身份 比如把 张三 换成 员工 A 把 华南事业部客户 001 换成 客户 A。

模糊化适合还要保留部分识别特征的场景 比如账号只留后四位 手机号只留前三后四。

删除适合该字段对分析完全没用的场景 比如身份证号列 如果你只是做费用汇总 根本不需要保留。

区间化适合既要看分布 又不能暴露精确数值的场景 比如工资 8000 元 可以处理成 6000 到 10000 区间。

选方法的核心不是哪种更高级 而是哪种既安全又不破坏后续分析。

最常见的错误是脱敏过轻 数据仍可被反推 以及脱敏过重 结果失去分析价值。

这一节先抓住
场景

案例一:做薪酬分布分析 金额适合区间化 不适合全部删掉。

风险

容易出错的地方通常出在知道四种脱敏方法分别适合什么场景。

动作

为每个字段写上推荐方法 比如 姓名用替换 手机号用模糊化 身份证号用删除 工资用区间化。

对照场景
相关案例 2

案例二:做银行流水对账 账号可只留后四位 不能全部替换到无法核对。

4 节 · 实操

工资表脱敏实操

把工资表里最常见的敏感字段逐列处理一遍。

工资表通常有 姓名 身份证号 手机号 部门 基本工资 绩效 公积金 实发合计。

先判断哪些字段必须处理。

姓名 身份证号 手机号属于高敏感 必须脱敏。

基本工资 绩效 公积金 实发合计也敏感 但如果你要分析分布和结构 不能直接删掉 更适合区间化或保留到百位。

部门字段通常可以保留 因为它本身是分析维度。

一个可执行的处理方式是 姓名改成员工编号 身份证号整列删除 手机号只留前三后四 薪酬字段改成区间或保留到百位。

处理完后再检查一遍 是否还能看出部门薪酬差异 是否还能做人数分组统计。

如果做完脱敏后连哪个部门工资偏高都看不出来 说明处理过重 需要回调。

这一节先抓住
场景

案例:做部门薪酬结构分析时 保留部门和薪酬区间 删除身份证号和完整手机号 就能既保护个人信息 又保留分析价值。

风险

容易出错的地方通常出在把工资表里最常见的敏感字段逐列处理一遍。

动作

先用一张小样表试做 处理后再看能不能完成薪酬分布分析 再决定是否整表批量执行。

5 节 · 实操

银行流水和客户对账单怎么脱敏

掌握两类高频表格的脱敏思路 不是只会处理工资表。

银行流水最敏感的通常是账号 户名 交易对手和备注。

客户对账单最敏感的通常是客户名称 联系人 电话 地址和合同相关信息。

银行流水脱敏时 账号建议只留后四位 交易对手如果是个人必须替换 如果是重要企业客户 可以保留部分特征但不要原样暴露全部信息。

客户对账单中 联系人姓名建议替换 电话做模糊化 地址只保留到城市级别。

金额是否处理 要看你后面是不是还要继续核对 如果还要对账 就不要破坏金额本身 但可以去掉角分或只保留整数。

最容易犯的错是把客户名称全部替成 客户 A 客户 B 结果后续分析根本分不清重点客户和普通客户。

遇到这种情况 更稳的做法是保留分类标签或保留一部分可区分特征。

这一节先抓住
场景

案例一:银行流水里的 XX 集团是重点客户 不能完全抹掉 否则后续分析无法识别。

风险

容易出错的地方通常出在掌握两类高频表格的脱敏思路 不是只会处理工资表。

动作

分别做一版 银行流水脱敏规则 和 客户对账单脱敏规则 别把两种表混用同一套处理方式。

对照场景
相关案例 2

案例二:客户对账单里的联系人电话可以模糊化 但客户回款金额通常要保留 否则对账失去意义。

6 节 · 核验

脱敏后的人工复核怎么做

知道脱敏完成后 不是保存就结束 还要做放行检查。

AI 或批量规则做完初版脱敏后 先别急着继续分析。

第一步 抽样对照原始表和脱敏表 看高敏感字段是否真的被覆盖。

第二步 用搜索 条件格式 或长度公式去扫疑似完整身份证号 手机号 银行账号。

第三步 检查分析所需字段是否还可用 比如金额区间化后 是否还能看出分布差异。

第四步 专门回看备注列 文件名 和自由输入列 这些地方最容易漏。

第五步 记录核验结果 比如谁检查了哪张表 发现了什么问题 怎么修正。

真正可用的脱敏不是 看起来像处理过 而是既查不出敏感信息 又不影响后续分析。

这一节先抓住
场景

案例:一张脱敏后的工资表里 备注栏还留着员工身份证号 因为规则只处理了固定列 没扫自由文本 最后是人工搜索 18 位数字才发现。

风险

容易出错的地方通常出在知道脱敏完成后 不是保存就结束 还要做放行检查。

动作

给脱敏流程加一张核验清单 至少包含 抽样检查 格式搜索 可用性检查 和备注列复核。

7 节 · 总结

制作你的财务数据脱敏清单

把前面的判断方法沉淀成一张可以长期复用的清单。

一张可用的脱敏清单 至少要有六列 字段名称 敏感等级 是否必须脱敏 推荐方法 分析保留要求 人工核验状态。

最好再加一列 适用表格类型 比如 工资表 银行流水 客户对账单 合同摘要。

以后每次遇到新表格 先列字段 再按这张清单判断怎么处理 不要临时拍脑袋。

清单真正的价值在于 它能把你过去踩过的坑留下来。

比如某次因为备注列漏脱敏出过问题 以后就把 备注列必须检查 写进固定动作。

这样后面不管是谁接手 都不会从零摸索。

这一节先抓住
场景

案例:销售部新增了 客户回扣比例 字段 如果没有清单 很容易直接被带进 AI。

风险

容易出错的地方通常出在把前面的判断方法沉淀成一张可以长期复用的清单。

动作

把清单做成 Excel 模板 以后所有要输入 AI 的表格都先对照这张清单处理。

对照场景
相关案例 2

用清单逐列过一遍 就能及时把这种新增字段纳入脱敏规则。

课内练习

快练与任务练

已完成 0 / 6 道快练
Q1判断题

工资表中的‘姓名’字段不属于敏感数据,可以直接保留真实姓名。

Q2单选题

以下哪项数据属于财务工作中的高敏感数据?

Q3多选题

常用的数据脱敏方法包括哪些?( )

Q4判断题

AI完成脱敏后,可以直接用于生成分析报告,无需人工复核。

Q5单选题

对于银行账号脱敏,最合理的做法是:

Q6多选题

在脱敏客户对账单时,以下哪些字段通常需要处理?

T1任务练习

假设你收到一份工资表,字段包括:姓名、身份证号、手机号、部门、基本工资、绩效、公积金、实发合计、备注。请根据本课所学的财务数据脱敏规则,设计一份脱敏后的版本。要求:对每个字段写明采用的脱敏方法及理由,并说明保留哪些字段用于部门薪酬分析。最后,列出你需要人工核验的要点。