实习生面试：你这个客服项目为什么只用AI大模型，不用ES？- 校大

最近面试Java实习生，有不少同学简历上都写了AI客服，就问了一个211研究生：你的客服项目，为什么非要用AI大模型？之前行业通用的ES检索，为什么不用？
学生就卡住了。
今天说三点：

01 客服的解决方案不对

这个设计方案，又落入只知道“技术名词”的圈套，就是各种培训机构或者卖课的，张嘴就是各种技术名词，然后给你包装一个差不多的业务场景。
但是现在是多个人抢一个职位的时代，项目考察早就不是会几个名词就能得分的。而且背名词是最简单的，反而业务实现的能力是公司最需要的
很多同学就像外卖类的烂大街项目一样，又拿着抄，但根本不知道真实的商用客服系统是什么体量！方案适不适合？
C端的一个电商、平台客服，知识库都是几千上万份文档，上百万字的内容。
但所有开源大模型都有致命短板——上下文窗口限制。
主流的7B、13B模型，上下文无非就是8K、16K、32K，换算成汉字撑死几万字。
真实业务里，单一份产品文档就能塞满你的上下文，更别说检索上千份知识库文档，纯大模型根本加载不过来！
抛开可行性不谈，再说性能速度。哪怕你用顶配GPU加速，纯大模型完成一次完整检索，耗时也要5到10秒。放在商用客服里，用户问一个问题要等好几秒.
你写的demo之所以能跑通，只是因为偷懒用了两三篇短文档做测试。面试官只要是了解业务，一眼就能看穿你的假项目！

02 AI赋能，ES干活

很多人搞不懂ES和AI的区别，其实两者各司其职，缺一不可！
传统的老客服系统，清一色只用ES分词检索。它的优点很明显：速度极快，上千份文档检索只需要几十毫秒，完全满足商用并发需求。
但缺点是没有语义理解能力，只会机械分词匹配。
比如用户输入“货品不好要退款”，ES只会拆分出“货品”“不好”“退款”几个零散关键词，检索出来的内容杂乱无章，答非所问，这就是为什么老式客服特别“傻”。
而真正落地的专业项目，是AI赋能，ES干活！
第一步，用户提问后，先交给大模型做语义优化、关键词扩写与降噪。模型能读懂用户真实意图，剔除无效词汇，补充核心业务关键词，把杂乱的口语化问题，转化成精准的检索语句。
第二步，把优化后的语句，交给ES做高速检索，利用它的高性能快速筛选出相关文档，节省大量GPU算力成本。
第三步，再用大模型的语言整合能力，把ES检索出来的生硬、零散内容，整理成通顺、贴合用户问题的标准答案。
AI负责懂语义、懂业务，ES负责高并发、快检索，这才是企业真正落地的标准方案！

03 客服很少纯用大模型

大厂ToC客服很少纯用大模型，核心原因是成本扛不住！
大家平时用淘宝、京东、阿里云的AI客服，应该能发现，很多时候还是很笨拙，不如人工精准。
不是大厂技术不行，是ToC端流量太大、并发太高！
哪怕用了AI+ES的最优方案，海量用户的高频访问，会让算力成本呈指数级暴涨，根本不划算。
所以大厂ToC客服，大多还是保守方案，优先保证稳定和低成本。
而垂直行业的客服系统，才是AI+ES方案的最佳场景！
比如医疗问诊、企业专属客服，流量不大、并发不高，但对回答的精准度、专业性要求极高。不需要极致速度，但必须读懂用户深层需求、输出专业答案，这种场景用这套组合方案，完美适配。
所以大家要结合这些垂直场景去优化一下项目