范子林
教育经历
南京信息工程大学 2017.9 - 2019.6
南京
- 电子信息工程 本科
工作经历
南京绛门信息科技股份有限公司 2019.11 - 2023.12
Agent 应用开发工程师 2022.1 - 2023.12
- 主要负责基于星云大模型的 AI 辅助编程插件开发,后面参与基于 vLLM 的大模型优化、推理、部署工作。
Java 后端开发工程师 2019.11 - 2021.12
- 主要负责中兴 XRExplore 平台,大空间云渲染应用的后端开发工作。工作内容包括应用的业务方案设计及后端开发,同时负责平台部分功能的开发,多次执行项目的落地任务。
项目经历
周易解卦 Web 应用
Agent 应用开发工程师
项目描述:
- 在线体验:ai.linspace.top
- 这是一款 AI 周易解卦 Web 应用,基于 DeepSeek-R1-1.5B-Distill 模型进行 LoRA 微调,实现了智能化的周易解卦功能。
技术栈:
- 数据准备:
- 利用爬虫技术从相关网站抓取周易 64 卦相关数据,并经过清洗后存储至向量数据库。
- 使用 Faker 等工具模拟卦象、用户个人信息等数据,将其作为参数组装到 Prompt 中。并结合 RAG 技术,从向量数据库中提取相关信息,进一步丰富 Prompt 内容。最后使用 LangChain 批量调用能力更强的 Qwen-MAX 模型,生成模拟的周易解卦数据。
- 最终将 Qwen-MAX 的解卦数据清洗后保存为 alpaca 数据集,用于后续微调。
- 模型微调:结合硬件资源(GTX 1050Ti 2GB)和文本处理能力,选择了 DeepSeek-R1-1.5B-Distill 作为基座模型,使用 LLaMA Factory 对模型进行 LoRA 微调。
- 量化部署及推理优化:使用 llama.cpp 工具对微调后的模型进行格式转换与量化处理,大幅降低模型的存储需求和计算开销。同时,通过 llama.cpp 进行推理优化,成功将推理速度从 15 token/s 提升至 36 token/s,显著提高了应用的响应效率。
- 前端实现:前端采用 Streamlit 和 LangChain 技术栈构建,提供简洁直观的用户界面,用户在线输入卦象信息并实时获取解卦结果。
工作职责与成果:
- 负责周易解卦 Web 应用的全流程开发工作,包括数据采集与处理、模型微调、量化部署及推理优化等关键环节。
基于星云大模型的 AI 辅助编程插件 2022.1 - 2023.12
Agent 应用开发工程师
项目描述:
- 此项目围绕星云编程大模型打造的编程辅助插件,插件支持 IDEA、vsCode 等编辑器,Python、Java、C++ 等多种主流编程语言,提供了代码生成补全、代码重构、代码注释、生成单元测试等多种功能,为一万多员工提供准确高效的编程辅助。
技术栈:
- Prompt 工程:借助 LangChain 实现了一套复杂的 Prompt 构造机制,结合当前文件路径、语言标记、已输入代码片段等信息,为不同的功能任务,生成高质量的 Prompt。
- LLM 推理优化:基于 vLLM,从内存管理、算子融合、模型量化等方面提升模型的推理性能。
- 插件前端:基于对应的编辑器,实现插件的前端,以及一些用户体验优化,如:Debounce 机制、多线程处理提升响应速度等。
工作职责与成果:
- 负责 Prompt 工程的核心功能开发,使用思维链 CoT、RAG 等优化方法,针对不同的任务,构建高效简洁的 prompt,帮助模型生成高质量的回答。具体来说,分为三个步骤:首先,判断代码的具体场景,决定出最合适的生成策略,如:光标在代码中间位置,就会判断是 FIM 补全场景,生成的 prompt 就会做特殊优化,以适用模型专用的 FIM 接口。然后,基于 RAG 挖掘代码库中的相关代码片段,为模型构建理想的上下文环境。最后,模型根据已有的提示和上下文,智能生成代码片段。
- 参与了模型量化的相关工作,团队使用了训练后量化(PTQ)算法。CodeLLaMA 的 INT4 PTQ 量化模型在 HumanEval 测试中,性能和 16bit 的原始精度模型不相上下,同时在性能上也优于 AWQ 量化的模型。
ZTE XRExplore 平台——大空间云渲染应用 2019.11 - 2021.12
Java 后端开发工程师
项目描述:
- 大空间云渲染应用是基于 ZTE XRExplore 能力平台,云渲染场景下的应用集合。云渲染,即利用云端的高性能计算资源进行渲染,用户通过网络连接到云端获取渲染结果。
- 大空间应用的业务流程主要分布在三端: 应用端(web 端)、云渲染端、终端(VR 眼镜)。一个常规的业务流程:用户通过终端选择内容,提前分发的内容在云渲染端启动、渲染,应用协调终端和云渲染端的 SIP 通信,会话建立后,云渲染端的画面无缝推流至终端,构建起流畅的云渲染服务链路。
技术栈:
- 云计算框架:ZTE XRExplore 能力平台搭建在 TECS 云计算平台上,它基于 OpenStack + Kubernetes 开放架构,对计算、存储和网络虚拟化基础设施进行集中调度和管理。
- SpringBoot 微服务架构:ZTE XRExplore 能力平台及大空间应用均采用 SpringBoot 搭建微服务架构,利用其高效的开发框架与轻量级特性,实现服务的快速构建、灵活部署以及便捷的服务间通信,极大提升了项目的可维护性与扩展性,有效支撑复杂业务逻辑的实现。
- SIP 通信协议:在 ZTE XRExplore 能力平台丰富多样的 AR(增强现实)、VR(虚拟现实)、MR(混合现实)场景中,SIP 协议作为通信中枢,确保各端间数据的可靠、实时传输,为用户带来沉浸式交互体验提供了通信保障。
工作职责与成果:
- 负责大空间应用整体业务方案的设计与开发工作,高效完成团队交付的各项需求。期间主导推动云渲染时延优化任务,从渲染引擎、会话通信流程、终端画面渲染等多个技术维度进行深度优化。通过不懈努力,成功将云渲染时延从 70ms 降低至 40ms,显著提升了用户的云渲染体验,增强了产品在市场上的竞争力。
- 参与 ZTE XRExplore 平台的能力研发工作,主要负责的模块是 SIP SDK,以及会议控制服务的研发任务。
- 多次主导项目的落地实施,凭借丰富的现场网络及服务器部署经验,成功应对各种复杂问题,保障项目顺利交付并稳定运行。
专业技能
编程语言:Python(熟练)、Java(熟练)、JavaScript
开源框架:Langchain、vLLM、SpringBoot、Docker、llama.cpp、LLaMA Factory
数据库:PostgreSQL、Redis、FAISS