城市交通知识增强大语言模型构建及应用探索

城市交通是新技术、新产业的重要栖息地,是典型的知识、技术密集型行业,涵盖了交通运输、城乡规划、社会学、经济学、管理学等多个学科门类,应用场景多样且差异性较大。因此,从业人员对复杂问题的认知水平和新技术的掌握能力是培育新质生产力的关键。现阶段,中国城市交通面临着复杂性提升、决策响应快、科学决策需求高等挑战,这些挑战对从业人员的综合素养提出了更高要求,迫切需要提出创新理论方法体系,以提升行业新质生产力水平。
大语言模型(Large Language Models, LLMs,以下简称“大模型”)是生成式人工智能(Generative Artificial Intelligence, GAI)领域的重要分支,是新质生产力的关键技术。自2022年底OpenAI的ChatGPT推出以来,大模型便在全球学术界与产业界引发广泛关注,国内外众多机构陆续推出了各自的大模型,如Google的Gemini、Facebook的LLaMA、Mistral AI的Mistral-7B、OpenAI的文生视频模型Sora,以及近期推出的具备复杂任务推理能力的OpenAI O1等。而在中国,百度的文心一言、阿里巴巴的通义千问、智谱AI的ChatGLM等也在持续跟进,特别是2025年初深度求索公司推出的DeepSeek-R1受到广泛关注。
尽管大模型在处理通识性问答方面表现出色,但在涉及复杂决策的行业领域,仍普遍存在幻觉现象,以及可信性、可解释性差等突出问题。大模型的幻觉现象是指大模型生成内容时由于领域知识覆盖不全导致的训练数据偏差、缺乏事实验证机制,或推理过程中的错误匹配,致使生成不准确或虚假的信息。此外,由于大模型的参数规模庞大且缺乏明确的决策路径,使得其可解释性和可控性较差,难以追溯其生成内容的推理逻辑,在重视因果联系的应用领域难以获得用户信任。近年来从知识工程(Knowledge Engineering, KE)入手,将大模型和领域知识图谱有效融合,可以有效缓解大模型的幻觉现象,增强其在行业领域的适应性,是推进大模型落地应用的重要技术路径。大模型和知识图谱的深度融合是一个新兴研究领域,医疗、金融等行业已经展开了积极探索,并构建了医疗、金融等领域大模型,然而在城市交通行业仍处于早期探索阶段。
本文在梳理国内外研究现状的基础上,从知识图谱与大模型融合的思路出发,提出了城市交通知识增强大语言模型系统架构,探索了提示词工程、检索增强生成、模型融合及智能体构建技术,研发了城市交通知识增强大语言模型(TransKG-LLM),并从数据增强、知识增强、模型增强及任务增强等4个维度进行了实践探索。