西安交通大学刘佳鹏博士讲座

发布者:周瑾茹发布时间:2023-12-25浏览次数:10

主讲嘉宾:西安交通大学刘佳鹏博士

时  间:2023年12月28日09:00

地  点:信息楼510会议室

主  题:

Training AI to Interact with Decision Maker: A Multiple Criteria Preference Learning Approach Based on Variational Bayesian Inference and Monte Carlo Tree Search

摘  要:

在大语言模型等人机混合智能系统中,智能体如何准确高效地理解决策者偏好是一个关键问题。本研究提出了一种面向交互式多准则决策问题的偏好学习方法。该方法利用随机变分贝叶斯推断技术从决策者提供的偏好信息中构建决策者的偏好模型。由于使用了现代优化技术和重参数化技巧,该方法能够快速准确地计算偏好模型的后验分布。同时,为了在有限次交互中充分获取决策者偏好,该方法利用蒙特卡洛树搜索确定向决策者提问的问题序列,有效地提高了问题空间的探索效率。最后本研究通过大规模仿真实验验证了所提偏好学习方法的优势。

主讲人简介:

刘佳鹏博士,西安交通大学管理学院信息系统与智能商务系、智能决策与机器学习研究中心副教授、博士生导师。目前研究方向为:智能决策、机器学习、贝叶斯方法、大数据模型。近年来主持和参与国家自然科学基金青年、面上、重点、重大研究计划项目,国家重点研发课题,工信部专项课题,中央军委科技委***工程重点项目等多项课题的研究工作。研究成果发表在INFORMS Journal on ComputingEuropean Journal of Operational ResearchOmegaACM Transactions on Knowledge Discovery from DataExpert Systems with ApplicationsKnowledge-based Systems、系统工程理论与实践、系统工程学报等国际顶级期刊和国内外重要学术刊物。担任中国优选法统筹法与经济数学研究会智能决策与博弈分会理事,中国系统工程学会数据科学与知识系统工程专委会委员。获得陕西省科学技术进步奖二等奖、陕西省高等学校科学技术奖一等奖、李怀祖管理学研究成果奖、INFORMS MCDM Junior Researcher Best Paper Award Finalist等奖励。