大语言模型的原理与使用

发布时间：2025-06-25访问量：10

2025年6月25日下午，由上海社会科学院研究生院主办的“大语言模型的原理与使用”讲座在分部2号楼415报告厅顺利举行，本次讲座邀请了上海对外经贸大学统计与信息学院司继春老师作为主讲人，讲座由研究生院副院长邸俊鹏主持。

司继春老师系统性地阐释了大语言模型（LLM）的核心原理，及Transformer架构的运作机制，对比了基于编码器（如BERT）和基于解码器（如GPT系列）两大主流技术路径的异同与发展。

针对实际应用需求，司继春老师详细介绍了当前主流闭源（如ChatGPT、Claude、文心一言等）与开源（如Llama、通义千问、ChatGLM等）人工智能工具的特点、访问方式与实用技巧。为同学们演示如何有效利用这些工具提升研究效率，如何构建“人工智能工作流”和打造专属“智能体”（AI Agent）的方法论，并通过具体实例展示如何将大语言模型（LLM）深度整合到研究环节中，实现从信息处理、分析到内容生成的智能化辅助。

讲座聚焦LLM在人文社科领域的落地实践，结合丰富案例，生动展示了LLM如何助力文献综述、数据处理与分析、多语种资料翻译与解读、研究思路拓展、乃至在模拟社会行为分析等具体研究场景中的应用。最后，他指出，尽管人工智能工具在人文社科的应用尚处探索初期，但其在提升研究效率、挖掘数据深层价值、启发跨学科创新方面已展现出革命性的前景。他鼓励研究者们拥抱变革，积极探索LLM赋能研究的有效路径。

【演讲嘉宾资料】司继春，上海对外经贸大学统计与信息学院讲师，在《Journal of Business and Economic Statistics》、《中国人口科学》、《系统工程理论与实践》、《财政研究》、《财经研究》等期刊发表论文多篇，主持国家自然科学基金青年项目、上海市教委人工智能促进科研范式改革赋能学科跃升计划项目等多项。