阿里健康申请训练样本的生成方法专利,提升专业领域的专用大模型的训练效果
金融界2025年5月2日消息,国家知识产权局信息显示,阿里健康科技(杭州)有限公司申请一项名为“训练样本的生成方法、装置、设备、介质及程序产品”的专利,公开号CN119903916A,申请日期为2024年12月。
专利摘要显示,本申请实施方式提供了一种训练样本的生成方法、装置、设备、介质及程序产品。所述方法包括:从固定内容文件中识别得出文本数据段;基于所述文本数据段和所述固定内容文件调用多模态大模型,生成所述固定内容文件对应的目录数据;其中,所述目录数据包括与文本数据段对应的目录项;所述目录项用于指示文本数据段的位置;依照所述目录项排列所述文本数据段得到所述固定内容文件对应的目标文本数据;其中,所述固定内容文件和所述目标文本数据形成所述训练样本。训练样本的生成方法、装置、设备、介质及程序产品可以实现对固定内容文件包含的文本信息的结构化处理,增强训练样本的结构化程度,提升专业领域的专用大模型的训练效果。
天眼查资料显示,阿里健康科技(杭州)有限公司,成立于2017年,位于杭州市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本140000万人民币。通过天眼查大数据分析,阿里健康科技(杭州)有限公司共对外投资了2家企业,专利信息104条,此外企业还拥有行政许可5个。
本文源自:金融界
作者:情报员