【论文笔记-7】LLMLight-城市交通信号灯控制智能体
LLMLight: Large Language Models as Traffic Signal Control Agents. Siqi Lai, Zhao Xu, Weijia Zhang, Hao Liu and Hui Xiong. arXiv 2024.
动机
挑战1:如何让大语言模型LLM理解实时的交通动态信息和有效地与交通环境交互,对于基于大语言模型的交通信号控制是至关重要的?
挑战2:通用的大语言模型缺乏特定的领域知识,且容易出现幻觉问题。
任务
提出了一种交通信号控制代理框架LLMLight以及采用微调,为交通信号灯控制量身订做了智能体LightGPT。
方法
- Real time observation
- Task description
- Control action space
- Reasoning Trajectory Collection & Filtering
- Imitation Fine-tuning
- Critic-guided Policy Refinement
评价
- This is the first exploration of LLMs as decision-making agents in TSC (Traffic Signal Control).
- Extensive experiments on nine traffic flow datasets demonstrate the superior effectiveness, generalization capabilities, and interpretability of the LLMLight framework.
展望
- 多个交通十字路口的联合控制如何做?
- 实时交通信息只考虑了汽车,没有考虑行人以及自行车、电瓶车等。
- 实时的交通流量预测信息如何输入到这个LightGPT中,辅助交通信号灯控制?
更多
- 【论文笔记-1】注意力人流量机器
https://xiepeng21.cn/posts/a7c2a378/ - 【论文笔记-2】深度学习
https://xiepeng21.cn/posts/c0d0024f/ - 【论文笔记-3】用于交通预测的多范围注意力双组分图卷积网络
https://xiepeng21.cn/posts/e8cb7573/ - 【论文笔记-4】Attention Is All You Need
https://xiepeng21.cn/posts/d3e954aa/ - 【论文笔记-5】iTransformer
https://xiepeng21.cn/posts/4b43950f/ - 【论文笔记-6】城市大模型综述
https://xiepeng21.cn/posts/92078746/ - 【时空论文库】时空数据挖掘论文库
https://github.com/xiepeng21/research_spatio-temporal-data-mining - 【AI论文速读】综述:城市基础模型回顾与展望——迈向城市通用智能
https://mp.weixin.qq.com/s/hoC9g8hnOpZcSnmvv5Ac8A - 【论文解读】港科大(广州)发布大模型交通信号灯控制框架LLMLight
https://mp.weixin.qq.com/s/TxeeNKFqaP9rKj5Hd-xsXw
【论文笔记-7】LLMLight-城市交通信号灯控制智能体
https://xiepeng21.cn/posts/cfe671a9/