2-3 · Excel 与表格处理提效

财务数据清洗:日期、金额、摘要、空值

从公式层面进入数据处理层面。为多表匹配和对账打基础。

5 个关键知识点7 个讲义块6 道快练1 道任务练3 份模板可下载
返回模块页
本课产出银行流水清洗练习文件

先把《银行流水清洗练习文件》搭出第一版,不要只停留在看懂。

推荐学法

建议按“数据不先清洗 后面所有分析都会带着脏口径 -> 财务数据清洗要按顺序 不能想到哪列洗哪列 -> 日期和金额这两列 先洗干净再谈分析”的顺序往下看,先抓方法,再做练习和模板。

学习目标

从公式层面进入数据处理层面。为多表匹配和对账打基础。

  • 财务数据清洗的标准顺序
  • 统一字段、日期、金额、借贷方向、摘要、名称、编号的方法
  • 重复值、空值、异常金额的检查口径
先完成这三步
  • 先把《银行流水清洗练习文件》搭出第一版,不要只停留在看懂。
  • 拿 1 个真实场景试跑一遍,再补成自己的版本。
  • 固定写下 4 个人工复核点,别让 AI 输出直接进入正式工作。
带着这三个问题往下看
  • 这节课里,我最容易在哪一步偷懒或漏掉复核?
  • 我会在哪个真实工作场景里复用《银行流水清洗练习文件》?
  • 以后再做同类任务时,我要先检查哪 3 件事?

1 节 · 导入

数据不先清洗 后面所有分析都会带着脏口径

先理解数据清洗为什么是财务分析和对账的入口。

财务表最怕的不是字段多 而是看起来像同一列 实际塞了好几种口径。

日期列里既有 2026 01 31 又有 2026年1月31日 还有文本格式。

金额列里有 正数 负数 带逗号的文本 甚至括号表示负数。

摘要列有人写 差旅报销 有人写 差旅费报销 还有人只写 北京出差。

你如果不先清洗 透视表会分出一堆重复项 匹配公式会找不到键 对账结果会出现假差异。

清洗的价值不是让表看起来整洁 而是让后续每一步都建立在同一口径上。

这一节先抓住
场景

案例一:银行流水里同一天的日期格式有三种 导致按月份汇总时 一部分没被算进 1 月。

风险

容易出错的地方通常出在先理解数据清洗为什么是财务分析和对账的入口。

动作

拿出一张你最常做分析的原始表 看看日期 金额 摘要 有没有一列已经混了多种格式。

对照场景
相关案例 2

案例二:付款摘要里 同一家供应商有三种写法 后面对账时被当成三家。

2 节 · 概念

财务数据清洗要按顺序 不能想到哪列洗哪列

掌握一套更稳的清洗顺序。

推荐按五步清洗。

第一步 统一字段结构 先把列名改规范 补上缺失字段 明确每列用途。

第二步 统一日期和金额格式 因为这两列最直接影响计算。

第三步 清理摘要 名称 编码中的空格 全半角 简称别名。

第四步 处理空值 重复值 异常值 看哪些要补 哪些要标记 哪些要剔除。

第五步 做结果核验 确认清洗后还能追溯到原始数据。

顺序不要乱 因为你如果先匹配客户 再去清理客户名称 往往前面做的工作要重来。

清洗顺序本质上是在减少返工。

这一节先抓住
场景

案例一:先做对账 后面才发现摘要里有隐藏空格 之前的匹配结果等于白做。

风险

容易出错的地方通常出在掌握一套更稳的清洗顺序。

动作

给自己固定一个清洗顺序 字段 日期金额 名称摘要 空值异常 核验 五步别跳。

对照场景
相关案例 2

案例二:先删重复记录 后来才发现那两条其实是一借一贷冲销 不是重复。

3 节 · 操作

日期和金额这两列 先洗干净再谈分析

掌握最容易出错的两类字段该怎么处理。

日期清洗先做三件事 统一格式 识别文本日期 排除无效日期。

比如 2026 1 5 和 2026-01-05 最终都应回到同一日期格式。

金额清洗也做三件事 统一小数位 去掉文本符号 判断正负方向。

尤其银行流水和费用明细里 经常出现 借方为正 贷方为负 或 收入为正 支出为负 两套口径混用。

你必须先定一套标准 再全部改成同一方向。

否则后面的汇总和差异分析 看起来数字都在 实际口径已经反了。

日期和金额一旦统一 后面至少有一半问题会自动消失。

这一节先抓住
场景

案例一:银行导出的负数用括号表示 如果不转成数值 透视表会把它们当文本。

风险

容易出错的地方通常出在掌握最容易出错的两类字段该怎么处理。

动作

先从你的表里挑 10 行样本 检查日期是否都能参与日期运算 金额是否都能参与求和。

对照场景
相关案例 2

案例二:报销台账里一部分日期是文本 公式算天数时直接返回 VALUE 错误。

4 节 · 操作

摘要 名称 编码清洗 决定后面能不能匹配上

知道为什么摘要和名称不统一 会制造大量假差异。

财务表里最容易被低估的工作 就是把文字字段洗干净。

摘要要去掉无意义前缀 比如 付款 付款申请 付款成功 这类程序字眼。

名称要统一全称和简称 比如 华东贸易 上海华东贸易有限公司 华东贸易公司 最终要归到同一主体。

编码则要统一长度和格式 尤其前导零不能丢。

文字字段清洗的目标不是让表好看 而是为后面的匹配 留下稳定键值。

很多人把假差异误当真实差异 本质上不是业务出错 而是名称没洗干净。

这一节先抓住
场景

案例一:客户名称一边写 北京智云科技有限公司 一边写 智云科技 导致回款匹配总差一笔。

风险

容易出错的地方通常出在知道为什么摘要和名称不统一 会制造大量假差异。

动作

把表里出现次数最多的 20 个名称先拉一列 看有没有同一主体多种写法。

对照场景
相关案例 2

案例二:流水摘要有 POS 手续费 和 手续费 POS 两种写法 如果不统一 后面费用分析会拆成两类。

5 节 · 操作

空值 重复值 异常值 不同类型要分开处理

别把所有不正常的数据都粗暴删掉。

空值先判断是 本来就可以空 还是应该补录。

比如 摘要可空 与 税号缺失 完全不是一个风险级别。

重复值也要分 真实重复 录入重复 和 业务上合理的重复。

异常值则要先问 这是真异常 还是促销 大额付款 冲销等特殊场景。

财务清洗最忌讳的就是 看到不顺眼就删。

你删掉的 可能正是后面解释差异所需要的证据。

更稳的做法是 先新增一列状态标签 把 空值 待补 重复待核 异常待核 标出来 再决定后续动作。

这样你不会破坏原始信息。

这一节先抓住
场景

案例一:同一天同金额两条付款 看似重复 实际一条是货款 一条是运费。

风险

容易出错的地方通常出在别把所有不正常的数据都粗暴删掉。

动作

不要先删 先标记 给空值 重复值 异常值各加一个处理状态列。

对照场景
相关案例 2

案例二:一笔 50 万招待费看起来异常 最后发现是年度会议场地费 集中入账。

6 节 · 方法

怎么让 AI 帮你生成可执行的清洗 SOP

让 AI 输出的不是空建议 而是一张能照着做的动作单。

如果你只是问 如何清洗银行流水 AI 往往会给一堆正确但空泛的建议。

更有效的问法是 说明表结构 目标结果 和风险点。

比如 这是一张 3000 行银行流水 含 日期 摘要 收入 支出 余额 交易对手 备注 我需要把它清洗成可用于收款对账的标准表 请给出按列处理步骤 包括日期统一 金额方向统一 摘要关键词清理 客户名称标准化 空值标记和最终核验项。

这样 AI 才更可能给你一份像 SOP 的输出。

你最终要留下的 不只是本次清洗结果 而是一套下次还能重复执行的列级动作。

这一节先抓住
场景

案例一:只问 怎么清洗流水 AI 回答很泛。

风险

容易出错的地方通常出在让 AI 输出的不是空建议 而是一张能照着做的动作单。

动作

以后问清洗问题时 至少把 表头 目标表用途 风险点 这三项一起发给 AI。

对照场景
相关案例 2

补充表头和目标后 它能明确告诉你 先合并收入支出 再统一方向 再清理交易对手名称。

相关案例 3

案例二:告诉 AI 目标是做回款匹配 它就会优先强调 客户名称 和 交易日期 两列。

7 节 · 案例与总结

把银行流水清洗过程沉淀成你的标准文件

把一次清洗经验变成以后可以重复复用的模板。

建议把这节课沉淀成一份清洗练习文件 至少包含 原始字段 当前问题 清洗动作 处理公式 人工判断点 最终状态 六列。

比如 日期格式混乱 应对应 统一日期格式并验证能参与运算。

客户名称别名过多 应对应 名称映射表 和 标准名称列。

这样下次再拿到新的流水或费用明细 你不用重新想 从哪一列开始洗。

真正的价值 是你开始拥有一套自己的 财务数据清洗清单。

这一节先抓住
场景

案例:本月把银行流水洗干净后 下月只需要沿着同一张清洗清单复查 新问题只补充在新增规则里。

风险

容易出错的地方通常出在把一次清洗经验变成以后可以重复复用的模板。

动作

今天就把你手里一张真实原始表 做出第一版清洗清单 至少写清 5 个具体处理动作。

课内练习

快练与任务练

已完成 0 / 6 道快练
Q1判断题

在清洗日期字段时,AI可以自动将“2023/1/5”转换为“2023-01-05”,财务人员无需再核对转换后的日期是否正确。

Q2单选题

清洗金额字段时,发现某列金额既有“-500”又有“(800)”两种表示负数的写法,下列做法最合理的是?

Q3多选题

关于摘要清洗,以下做法中正确的有?

Q4判断题

清洗空值时,如果某行的金额字段为空,可以直接删除整行,因为空值意味着该笔交易不存在。

Q5单选题

在银行流水表中同时存在“借方金额”和“贷方金额”两列,清洗时最常见的标准化做法是?

Q6多选题

清洗银行流水时,需要特别检查下列哪些异常情况?

T1任务练习

任务:沿用正文里的银行流水清洗场景。你拿到一张 3000 行银行流水,当前问题包括:日期列同时出现 2026/1/5、2026-01-05、2026年1月5日;支出金额有 -500、(800)、文本 "1,200" 三种写法;交易对手名称同时存在 北京智云科技有限公司、智云科技、北京智云 三种写法;摘要列部分为空。请你输出一份《银行流水清洗 SOP》,至少完成: 1. 按 字段结构、日期金额、名称摘要、空值异常、结果核验 五步写处理动作。 2. 为 日期、金额、交易对手、摘要 四列分别写清 当前问题、清洗动作、清洗后目标格式。 3. 设计一张状态标签表,至少包含 待补摘要、名称待映射、金额格式异常、日期待确认 四类标签。 4. 最后补一句:清洗完成后,这张表如何继续用于收款对账。