【论文笔记-7】LLMLight-城市交通信号灯控制智能体

LLMLight: Large Language Models as Traffic Signal Control Agents. Siqi Lai, Zhao Xu, Weijia Zhang, Hao Liu and Hui Xiong. arXiv 2024.

动机

挑战1:如何让大语言模型LLM理解实时的交通动态信息和有效地与交通环境交互,对于基于大语言模型的交通信号控制是至关重要的?

挑战2:通用的大语言模型缺乏特定的领域知识,且容易出现幻觉问题。

任务

提出了一种交通信号控制代理框架LLMLight以及采用微调,为交通信号灯控制量身订做了智能体LightGPT。

方法

LLMLight

  • Real time observation
  • Task description
  • Control action space

LightGPT

  • Reasoning Trajectory Collection & Filtering
  • Imitation Fine-tuning
  • Critic-guided Policy Refinement

演示系统:https://llmtscs-demo.vercel.app/

源代码:https://github.com/usail-hkust/LLMTSCS

评价

  1. This is the first exploration of LLMs as decision-making agents in TSC (Traffic Signal Control).
  2. Extensive experiments on nine traffic flow datasets demonstrate the superior effectiveness, generalization capabilities, and interpretability of the LLMLight framework.

展望

  1. 多个交通十字路口的联合控制如何做?
  2. 实时交通信息只考虑了汽车,没有考虑行人以及自行车、电瓶车等。
  3. 实时的交通流量预测信息如何输入到这个LightGPT中,辅助交通信号灯控制?

更多

  1. 【论文笔记-1】注意力人流量机器
    https://xiepeng21.cn/posts/a7c2a378/
  2. 【论文笔记-2】深度学习
    https://xiepeng21.cn/posts/c0d0024f/
  3. 【论文笔记-3】用于交通预测的多范围注意力双组分图卷积网络
    https://xiepeng21.cn/posts/e8cb7573/
  4. 【论文笔记-4】Attention Is All You Need
    https://xiepeng21.cn/posts/d3e954aa/
  5. 【论文笔记-5】iTransformer
    https://xiepeng21.cn/posts/4b43950f/
  6. 【论文笔记-6】城市大模型综述
    https://xiepeng21.cn/posts/92078746/
  7. 【时空论文库】时空数据挖掘论文库
    https://github.com/xiepeng21/research_spatio-temporal-data-mining
  8. 【AI论文速读】综述:城市基础模型回顾与展望——迈向城市通用智能
    https://mp.weixin.qq.com/s/hoC9g8hnOpZcSnmvv5Ac8A
  9. 【论文解读】港科大(广州)发布大模型交通信号灯控制框架LLMLight
    https://mp.weixin.qq.com/s/TxeeNKFqaP9rKj5Hd-xsXw

【论文笔记-7】LLMLight-城市交通信号灯控制智能体
https://xiepeng21.cn/posts/cfe671a9/
作者
Peter
发布于
2024年6月18日
许可协议