9月20日上午,信息学院大规模流数据集成与分析技术北京市重点实验室邀请了酷克数据首席科学家杨胜文博士进行了题为“企业数据仓库加速AI落地:方法、工具及大语言模型应用实践”的学术报告和交流。本次报告由实验室的王桂玲研究员主持,实验室主任韩燕波教授代表实验室师生对杨胜文博士表示了热烈的欢迎,信息学院七十多位同学参加了此次学术活动。
杨胜文博士首先从数据平台技术的演进过程入手,介绍了传统技术中目前存在的问题,继而引入了一个以HashData为代表的现代企业数据仓库,并提出了企业数据仓库和AI技术结合的新范式,这使得从数据处理、模型训练到智能应用开发变得更加高效。杨博士具体介绍了一个数据科学和AI开发工具HashML,并从两个语言模型ReQA和ChatData的具体实践角度阐述了基于HashML的实际应用场景。在演讲过程中,杨胜文博士还回答了老师和同学们的问题,与师生就相关问题进行了充分地交流和讨论,现场气氛热烈。
杨胜文博士毕业于清华大学计算机系,现任酷克数据首席科学家。曾任百度大数据技术委员会主席、主任架构师、大数据部技术负责人,更早前在EMC、Yahoo Beijing Labs、HP Labs China从事研发工作。在大数据分析、数据挖掘、数据智能等领域深耕多年,在互联网用户理解、产业数据智能、人工智能行业应用等领域有着丰富的实践经验。获得2022年度教育部科学技术进步奖一等奖。