本讲座选自瓜子二手车新零售产品负责人、清华电子系校友周洲于近期在清华大数据“应用·创新”系列讲座上所做的题为《如何玩转AI赋能下的新零售》的演讲 。
后台私信回复“181123”下载完整版PPT
周洲:首先介绍一下我们新零售的情况,然后会深度探讨如何利用AI在新零售行业落地 。
中国整体二手车市场的情况 。此前我对二手车行业进行了走访调研,深度调研后发现这个市场其实很复杂 。这里先介绍一下柠檬市场 。
这位是乔治教授 , 2001年诺贝尔经济学奖得主,得奖的核心理论就是柠檬市场理论(The Market for Lemons):典型的信息不对称市场中,当产品的卖方对产品质量比买方有更多的信息时 , 低质量产品将会驱逐高质量商品,从而使市场上的产品质量持续下降 。另一个常听说的理论叫:劣币驱逐良币,指的是在传统贵重金属作为货币的市场里面,不同的机构发售的银币的银含量不一样 。发行方知道一个银币里面的准确含量,从而带来信息不对称 。如果分别流通99.9%和95%两种银含量的银币,99.9%的银币很快就在市场逐渐消失了 。因为知道这个信息的玩家或者发行机构就会把99.9%的银币收藏起来,更多的拿95%的银币在市面上流通 , 因为这样更有利可图 。这也是典型信息不对称的残次品理论 。柠檬市场就解释了这样的市场 。乔治教授提出柠檬市场背后的核心是美国二手车市?。蛭殖凳谐∈且桓龅湫偷男畔⒉欢猿剖谐?。
在中美二手车市场里,美国整体汽车消费依然比中国领先很多,中美的汽车普及率相差也很多 。美国去年二手车成交量接近四千万台,新车1700万台 。中国恰好相反 。这说明:
- 第一,中国在二手车市场上存在非常大的机遇 。主要因为这个行业之前发展的不够快,需要很多积累,这种行业会在中国未来有一些捷径可走 。
- 第二,如何抓住机会 。二手车市场的信息不对称导致了今天的低效和信息不透明,可以通过互联网来解决这些问题 。
瓜子具体做了哪些事呢?首先是把信息规范化、透明化 。我们定义了二手车行业的标准,车况的检测评判标准 , 把一车一况的非标品通过规范化的定义转化成标品 。在此基础上 , 还需要解决行业传统陋习问题,也就是业务员为了拿到个人好处费,让买家和卖家跳过平台成交 , 行话俗称“飞单” 。通过智能云评估,评估师上门评估时将车的检验项目通过智能眼镜实时传回总部,通过总部运营巡检的人员可以规避飞单的情况 。
由于二手车市场的信息不对称导致大家对价格没有准确的判断,所以定价是整个二手车交易的核心 。传统的定价方式通常是对车和市场行情比较了解的车商,根据经验给出定价 。这样的模式基于个人的判断稳定性,无法实现可扩展和平台的规模化 。
我们主要通过AI机器学习来解决定价问题,上图是整个定价模型的大概系统框架 。我们通过评估师执行检测标准,将车况信息作为输入 , 通过机器学习模型计算得到评估价格 。除了通过机器学习来做定价,瓜子还在模式定价能力的基础上做新零售 。传统的瓜子帮助个人卖家卖给个人买家 , 没有中间商赚差价,但这个模式的问题在于效率非常低 。与二手房选房地址相对确定相比,二手车目标不明确 。而且一个社区可能就有很多套房源,而瓜子线上车源平台上的某款车源可能分别在石景山、顺义、大兴,这会导致过程非常低效且买家卖家体验都不好 。为了解决这个问题,我们在新零售阶段开了严选直卖店 , 希望将4S店标品化的车、服务以及体验的理念拿到二手车行业上来 。今年我们在全国近100个城市开大面积的店 , 一次性为买家提供足够多的车选择,自然能很好的解决效率问题 。对于车主提高了体验,平台的效率也得到极大的提升 。
前面是模式上的改变,我们还希望通过互联网 二手车,做一些技术赋能来解决这个行业的低效不透明 。上图左侧是一个智能钥匙柜 , 大家可以想象成蜂巢无人值守的收快递货柜 。中间是一个智能摄像头,主要用来预判库里的车位 。我们的卖场有两千台车,一天卖掉几百辆后中间就会空下来,当天还会有新进来的车又要停放到合适的车位里 。同时为了买家的带看效率,需要将同类车更多的停在一起 。这种背景下 , 两千台车每天需要不停的去做排列组合,依靠人工很难去做这样的决策和调度 。我们通过摄像头扫描车的挡风玻璃上的二维码得到车的信息,通过车位上的二维码来识别车位信息 。这样将车和车位信息输入到系统里 , 通过算法实现调度,通过与第三方合作的挪车机器人来实现运输 。
2017年我们为卖家多卖了15亿,为买家节省了6亿 。这两个数据来源于计算卖家在瓜子个人和个人的成交价,相比卖给车商的差价,以及反过来买家在瓜子买的价格 , 相比从二手车商购买的差价 。下面跟大家分享下瓜子如何实现落地和应用 。
AI在改革传统行业落地的三部曲 。
- 首先是线上化,例如通过摄像头如何挪车和车位信息线上化,否则计算机根本没有处理的基础 。
- 第二个是数据化 , 将线上化的信息在每一个对应的环境中都进行数据存储,为后面的机器学习所使用 。
- 完成前面两个,机器学习就可以进行智能化的工作 。分别看一下这三个环节瓜子主要的工作,供大家参考 。
线上化期间我调研了美国最大的在线二手车交易商CarMax 。加州的CarMax的每台车上有一个小钥匙盒,所有的钥匙盒子都由同一把万能钥匙打开 。每个销售可以通过万能钥匙拿到每台车的钥匙,不需要回到总部重新换钥匙,很便捷 。但这种方式的问题在于,这家老企业丢失了用户的购买意向 。大家到二手车市场去看车时,选择是会变化的 , 用户在选择中的决策路线在这种传统方式下将完全丢失,这也就失去了利用这些信息去做决策和优化的机会 。所以我们设计了智能钥匙柜来改造和提升行业效率 。
左下角这个图的小柜子里面放着某台车的钥匙 。每个销售带看客户的时候 , 他先通过工作手机到钥匙柜前取钥匙,然后带这个客户去看那台车 。这带来的好处是我们对消费者整个的购买决策路径非常清晰,并且连他决策的时长都很清晰,这些数据可以在未来实现很好的优化 。我们通过对记录的购买决策路线进行线上优化,把车和钥匙柜分区摆放,解决取钥匙的便捷性并提升了效率 。
第二步就是如何实现数据化 。当业务需求很明确的时候,核心的数据很容易定义出来 。但如果只聚焦结果,可能会导致只记录和结果最相关的那些数据 。我们之前的一个痛点就是,只记录目标相关的数据,但当机器学习模型决策出一些不可解释的结果,在前面数据记录的不够充分情况下,要去复盘分析原因就会非常困难 。所以在今天的存储成本下,我们的经验是只要你犹豫是否记录的数据 , 就先记下来,很可能很快就会用到这个数据 。
智能化分为四块 。首先是定目标,先界定问题 。接下来选特征对机器学习很重要 。特征选好后,最重要的是数据 。
特征方面,比如二手车 , 影响价格的最主要因素对建模非常关键 。所以从技术方面来讲,如果我们要在传统行业把机器学习的知识用好,深入理解这个行业的特点特别重要 。
第三是筛数据 。如何获取高质量有效的数据源,会对结果产生非常大的影响 。
判定结果这部分具有很大挑战性 。机器学习的技术指标好并不代表业务落地就好,最关键的是从业务上如何判断模型的结果好坏 。UBI和OBI是我们对于定价模型给出结果的衡量指标 。UBI表示低估了车价指数;OBI表示高估了车价指数 。左侧红线是低估的深度 , 这个曲线在一开始是相对往下走,说明我们的模型在不断改进 。橘色是每台低估车的车价相对比例 。这个曲线相对往上走,说明我们模型给出的价格比较好 。18年5月橘色的曲线在翘头 , 意味着模型给出的价格出现更多的偏低 。通过这样一些业务指标,我们能够更好的判断模型的结果 , 并且指引模型怎么样在下一步做优化 。
【附PPT下载 瓜子二手车是如何玩转AI赋能下的新零售】以上是使用AI落地赋能二手车的实践 。二手车行业确实是非常的低效不透明,经历着美国非常早期的阶段 。因此我们还有机会和后发优势 , 希望通过AI和技术手段来改造这个行业 。
后台私信回复“181123”下载完整版PPT
— 完 —
关注清华-青岛数据科学研究院官方微信公众平台“THU数据派”及姊妹号“数据派THU”获取更多讲座福利及优质内容 。