上海奇思申请基于loss值的金融大模型微调自适应学习专利,解决大模型面对金融数据训练学习效率低下的问题
金融界2025年5月1日消息,国家知识产权局信息显示,上海奇思信息技术有限公司申请一项名为“一种基于loss值的金融领域大模型微调的自适应学习方法”的专利,公开号CN119886253A,申请日期为2025年1月。
专利摘要显示,本发明涉及一种基于loss值的金融领域大模型微调的自适应学习方法,包括以下步骤:步骤1.收集各个开源的全量金融数据集,对选定的预训练模型进行微调,获得预微调模型A;步骤2.使用通过步骤1获得的预微调模型A,对每一个样本进行预测得到每个样本的损失函数值;步骤3.将损失函数值进行升序排序,并训练Qwen72B预训练模型得到模型B;步骤4.采用一种基于损失函数值的动态数据采样方法来进行自适应学习,根据模型在每一轮训练中的表现,调整训练数据的选择。解决了大模型的微调在面对金融数据的训练过程中出现学习效率低下的问题,该方法能够有效地优化金融大模型在处理不同难度任务时的学习效率和性能,同时减少过拟合和训练不稳定的风险。
天眼查资料显示,上海奇思信息技术有限公司,成立于2011年,位于上海市,是一家以从事其他金融业为主的企业。企业注册资本20000万人民币。通过天眼查大数据分析,上海奇思信息技术有限公司共对外投资了2家企业,参与招投标项目143次,财产线索方面有商标信息23条,专利信息8条,此外企业还拥有行政许可7个。
本文源自:金融界
作者:情报员