报告题目:人工智能:强化学习的基本理论及其应用
主要内容:讲述及探讨强化学习的基本理论及其应用。强化学习是机器学习的一种范式,它通过与环境的交互来学习如何实现特定的目标。其核心是智能体(Agent)通过与环境(Environment)的交互学习最优策略,以最大化长期累积奖励(Cumulative Reward),这通常涉及到策略的学习,即在给定状态下选择最佳动作的规则。学习目标为熟悉强化学习的主要思路使得学生在学习高级强化学习算法的时候有良好的理论基础。
报告人:方辉
报告人所在单位:英国拉夫堡大学
报告人职称/职务及学术头衔:博士
时间:2025年4月22日14:00-16:00
地点:云塘校区文科楼D505
报告人简介:2006年毕业于布拉德福德大学主攻多媒体基于内容的智能检索,致力于开发图像压缩域快速检索与管理系统,曾应用于欧盟 FP6 框架下伦敦奥运点播查询系统,2006-2015年于牛津大学等多所英国知名高校从事博士后研究员工作,曾领导开发国际地震中心可视化地震数据分析平台,入选牛津大学社会影响力案例,2015年到2018年期间就职于知山大学和利物浦约翰莫尔斯大学,2019年1月入职拉夫堡大学。近年来主持国家级科研项目多项,包括:创新英国 KTP项目(KTP PROJECT £197,792),创新英国SMART GRANT,英国科学工程理事会工业合作基金,英国科学工程理事会项目等,其中大型项目成果:与伦敦奇点智能公司的开发产品已被联合利华及荷兰卡夫享氏公司采用;与利兹教学医院开发的视觉体液健康系统也在原型测试阶段;已在顶级会议和顶级期刊 (CVPR, AAAI, ECCV,IEEE TRANSACTIONS ON VISUALIZATION AND COMPUTER GRAPHICS, PATTERN RECOGNITION等)发表论文150余篇。同时,担任多个国际著名期刊和会议编辑,包括 EUROVIS., INTERNATIONAL CONFERENCE ON COMPUTATIONAL VISUAL MEDIA (CVM), COMPUTER GRAPHICS AND VISUAL COMPUTING (CGVC), INTERNATIONAL CONFERENCE ON EMERGING UBIQUITOUS SYSTEMS AND PERVASIVE NETWORKS (ICEUSPN), GUEST EDITOR OF SPECIAL ISSUE IN MDPI ENTROPY, AI Communications 副主编。
承办单位:国际工学院 通识教育中心