2023-11-23
演讲人:携程集团技术副总裁 王清
导言:在“2023世界旅游联盟·湘湖对话”“科技赋能——旅游是产业共融的力量”环节,携程集团技术副总裁王清以“携程问道——旅游行业大模型及应用”为主题进行了精彩分享。
相关内容摘编如下:
今年7月携程发布了旅游行业的第一个垂直大模型——“携程问道”。简单跟大家介绍一下旅游业的模型细节,包括我们的思考以及目前的一些应用进展。
目前,大模型能够理解用户,但它生成的内容还不够靠谱。虽然现在业内也在探索不同的解决方案,但达到的效果并不乐观。所以,我们需要基于垂直定制来提升答案的准确率,这是我们做大模型非常重要的出发点之一。那么,如何在OTA行业利用大模型?我们内部总结出以下三点:第一,在用户制定旅游计划时,结合行业数据、实时数据,提升制定旅行计划和预定商品和服务的效率;第二,售后服务,OTA行业是服务电商,售后服务相对来说很重要,可以基于提升大模型理解的准确度,提升用户体验;第三,在途服务,旅途中可以通过智能化导游和途中服务提供旅游信息。
如何保证这三点的可靠性?第一,我们需要做定制,定制行业大模型,以更好地理解用户需求,通过行业数据二次训练,提升它对知识的理解,便于回答用户的问题。目前携程已经有300亿Tokens的训练数据,在通用大模型基础上,进行了二次训练。第二,携程问道会结合现有实时数据,如酒店、机票的实时状态,回答用户的问题。第三,根据用户搜索、订单、点评等数据,针对常见问题进行各类榜单制作,保证内容准确性。第四,与现有搜索和机器人算法进行结合。
为什么要做榜单?很重要的一点是,游客行程对于现在所有大模型来说,都很难保证答案的准确性和可用性。为了解决这一问题,我们针对国内外头部旅游目的地的常见需求、常见主题,基于海量数据,生成榜单,再通过人工校验质量,最终所有的榜单都经过全球三百多个国家进行打分评估挑选出来。为了保障数据的准确性,我们更多地使用站内数据检索,通过大模型总结的方式生成。当然我们也无法覆盖所有内容,因此还会基于搜索引擎进行回复。
我们当前的榜单主要是这几类:第一,热点榜,紧跟热点。第二,特价榜,由于用户对价格很敏感,我们的价格数据都是实时的,而且所有折扣都是真实的。第三,酒店榜,主要是一些主题酒店。第四,景点榜。第五,行程榜。我们也在持续扩大行程榜覆盖,现在正在覆盖东南亚、日韩、欧美地区。
我们会聚焦旅游行业,基于大模型做好智能助手的服务包括售前、售后、途中。我们会投入巨大的人力保证常用内容的质量,逐渐建立用户对AI服务的信任。通过这些数据我们了解到,用户目前对AI最大的期待更多是旅行内容,我们会投入更多人力保证行程质量,服务好用户。