我用AI整理了2万行物料数据,省了好几天
供应链 × AI · 实战手记
我用AI整理了
2万行物料数据
省了好几天
=========================
5个工厂 · 17个品类 · 中英混排命名 · 两个时间截面的变化比对
这是我怎么和Claude一起搞定的
24K+
物料行
1,881
新增物料
96.5%
自动归类率
先说一件让我有点尴尬的事:
项目做到一半,客户问我——"两个月之间的库存数据,哪些物料是新增的,新增主要集中在哪些品类?"
我打开Excel,看着两万多行中英混排的物料描述,想了大约三秒钟——
"这要手工做,我可能要盯着屏幕到天黑。"
然后我打开了Claude。
这篇文章记录的,是我们一起怎么搞定这件事的—— 包括中间踩的坑、纠过的错,以及那个让分类覆盖率达到96.5%的关键思路。
01
这份数据,长什么样
背景是帮某装备制造企业(下称"B公司")做库存管理诊断。B公司有5个独立核算的制造工厂,SAP里跑着超过2.4万个活跃物料。
物料涵盖的范围极广:从铸件毛坯、滚动轴承、机械密封,到六角螺栓、O形圈,再到铭牌、扎带……每一类的命名规则都不一样。
我们需要建立一张"品类映射表",把每个物料归入对应的二三级品类,然后对比12月和2月两个时间截面,看看哪些是新增的,变化集中在哪里。
📋 SAP 导出数据样例(脱敏)
物料描述英文描述状态
O形圈 410,00X5,00O-RING 410,00X5,00新增
轴承室 K28 E630 G95BEARING HOUSING K28新增
带颈对焊法兰 RF 2-80 CL600WELDING NECK FLANGE待归类
…(共1,384条)——
⚠️ 坑 #1:先把"新增"的定义搞清楚
我最初把"12月映射表里没有的物料"都当成新增,结果发现有1,650个物料其实早就在12月SAP数据里,只是没被归类。真正意义上的新增(2月首次出现在库存中)只有1,881个。差点让分析结论跑偏。
02
三步走,人和AI各管什么
在开始之前,我花了5分钟和Claude说清楚两件事:数据结构是什么,以及我们要回答的业务问题是什么。这一步省了后面很多来回。
1
摸清数据,踩完格式坑
SAP导出的CSV里藏着金额字段带逗号、字段有尾随空格、物料编号前后有空格等问题。Claude帮我写了清洗函数,10分钟搞定。
🤖 AI写代码👤 人提需求+验证
2
识别真正的新增物料
用集合差运算找出2月新出现的物料,再尝试用物料编号跨工厂匹配已有分类。497个直接"认亲",剩1,384个需要进一步处理。
官网摘要已读完
关注公众号后继续阅读
官网页面主要呈现文章脉络和关键上下文。完整内容、图表、案例细节和活动信息,请关注微信公众号「乐思门咨询」后,在公众号内搜索本文标题阅读原文。