专刊简介:
随着大模型在自动驾驶、航空航天、智能物联网等领域的逐步推广,如何将其高效部署在资源受限的边缘侧设备(如车载、机载、星载等系统)上已成为当前学术界和工业界共同关注的焦点。边缘侧大模型不仅需要具备多模态整合和轻量化推理的能力,还需要充分优化算力资源、提升服务效率、降低推理成本,并适合部署在异构计算硬件平台上。为满足这些需求,提升生态协同效率,并在“性能优先”和“成本优先”之间灵活权衡,相关研究正在不断深入。以车载系统为例,由于其计算、存储、能耗等方面的严格限制,实现低延迟、高可靠、高能效的大模型推理成为一项极具挑战性的任务,并涉及模型优化、硬件加速技术、网络通信、端云协同等多个领域。
一、征文范围:
因此,本专刊重点关注在资源受限的边缘侧设备上实现大模型性能加速、模型优化以及端云协同等方面的创新技术和解决方案。具体包括但不限于以下技术方向:
1)面向边缘侧大模型的硬件优化技术,利用GPU、FPGA、ASIC等硬件特性进行模型加速。
2)边缘侧大模型的异构资源管理策略,通过协同抽象和融合管理实现异构资源池的高效利用。
3)轻量化大模型的压缩与部署方法,包括模型压缩、剪枝、量化等优化技术在边缘侧设备的应用。
4)嵌入式推理框架与内存管理策略,优化轻量化大模型的计算和存储效率。
5)端云协同与跨域跨端的分布式基础设施,利用多端算力提升资源利用效率。
6)边缘侧大模型优化的应用案例分析,促进国产化边缘侧大模型生态的发展。
特约编辑:
孙毓忠(中科院计算所 )
宋莹(北京信息科技大学)
戚正伟(上海交通大学)
李建欣(北京航空航天大学)
二、投稿要求:
1. 稿件类型:
1) 原创性研究论文
2) 高质量综述论文
2. 稿件要求:
1) 首先要向中国软件大会Chinasoft2024投稿,投稿使用EasyChair系统( https://easychair.org/conferences/?conf=ccfchinasoft2024)。
具体投稿要求,投稿格式参照:http://cjc.ict.ac.cn/wltg/zgjz.htm。
2) 来稿内容应属于作者的科研成果,数据真实、可靠,未公开发表过;引用他人成果已注明出处;署名无争议;是有创新学术见解的研究成果的完整论述,对该学术领域的发有积极意义。
3) 论文语言流畅,可读性强,表述清楚、无逻辑和语法错误;审稿人审理时无阅读、理解障碍。
三、重要时间:
1) 第一阶段:ChinaSoft2024会议投稿
ChinaSoft会议论文截稿时间:2024年9月1日,投稿中选择本track。
审稿结果通知日期:2024年10月20日
修改稿返回时间:2024年11月10日,本track评委会审查修改情况。
2) 第二阶段:会议报告及修改提交
ChinaSoft 2024会议时间:2024年11月15-17日,西安。注意:第一阶段获选的论文至少要有一名作者来大会现场宣读论文并回答评委和听众提问。
根据口头宣讲论文中听众和评委意见再次修改,修改稿提交日期:2024年12月20日。
3) 第三阶段:
2024年12月25日,本track评委审议并通知被择优推荐的会议论文作者,由《计算机学报》再组织一次其内部评审以确定是否发表。