最近面试Java实习生,有不少同学简历上都写了AI客服,就问了一个211研究生:你的客服项目,为什么非要用AI大模型?之前行业通用的ES检索,为什么不用?
学生就卡住了。
今天说三点:
01 客服的解决方案不对
这个设计方案,又落入只知道“技术名词”的圈套,就是各种培训机构或者卖课的,张嘴就是各种技术名词,然后给你包装一个差不多的业务场景。
但是现在是多个人抢一个职位的时代,项目考察早就不是会几个名词就能得分的。而且背名词是最简单的,反而业务实现的能力是公司最需要的
很多同学就像外卖类的烂大街项目一样,又拿着抄,但根本不知道真实的商用客服系统是什么体量!方案适不适合?
C端的一个电商、平台客服,知识库都是几千上万份文档,上百万字的内容。
但所有开源大模型都有致命短板——上下文窗口限制。
主流的7B、13B模型,上下文无非就是8K、16K、32K,换算成汉字撑死几万字。
真实业务里,单一份产品文档就能塞满你的上下文,更别说检索上千份知识库文档,纯大模型根本加载不过来!
抛开可行性不谈,再说性能速度。哪怕你用顶配GPU加速,纯大模型完成一次完整检索,耗时也要5到10秒。放在商用客服里,用户问一个问题要等好几秒.
你写的demo之所以能跑通,只是因为偷懒用了两三篇短文档做测试。面试官只要是了解业务,一眼就能看穿你的假项目!
02 AI赋能,ES干活
很多人搞不懂ES和AI的区别,其实两者各司其职,缺一不可!
传统的老客服系统,清一色只用ES分词检索。它的优点很明显:速度极快,上千份文档检索只需要几十毫秒,完全满足商用并发需求。
但缺点是没有语义理解能力,只会机械分词匹配。
比如用户输入“货品不好要退款”,ES只会拆分出“货品”“不好”“退款”几个零散关键词,检索出来的内容杂乱无章,答非所问,这就是为什么老式客服特别“傻”。
而真正落地的专业项目,是AI赋能,ES干活!
第一步,用户提问后,先交给大模型做语义优化、关键词扩写与降噪。模型能读懂用户真实意图,剔除无效词汇,补充核心业务关键词,把杂乱的口语化问题,转化成精准的检索语句。
第二步,把优化后的语句,交给ES做高速检索,利用它的高性能快速筛选出相关文档,节省大量GPU算力成本。
第三步,再用大模型的语言整合能力,把ES检索出来的生硬、零散内容,整理成通顺、贴合用户问题的标准答案。
AI负责懂语义、懂业务,ES负责高并发、快检索,这才是企业真正落地的标准方案!
03 客服很少纯用大模型
大厂ToC客服很少纯用大模型,核心原因是成本扛不住!
大家平时用淘宝、京东、阿里云的AI客服,应该能发现,很多时候还是很笨拙,不如人工精准。
不是大厂技术不行,是ToC端流量太大、并发太高!
哪怕用了AI+ES的最优方案,海量用户的高频访问,会让算力成本呈指数级暴涨,根本不划算。
所以大厂ToC客服,大多还是保守方案,优先保证稳定和低成本。
而垂直行业的客服系统,才是AI+ES方案的最佳场景!
比如医疗问诊、企业专属客服,流量不大、并发不高,但对回答的精准度、专业性要求极高。不需要极致速度,但必须读懂用户深层需求、输出专业答案,这种场景用这套组合方案,完美适配。
所以大家要结合这些垂直场景去优化一下项目
帖子还没人回复快来抢沙发