上海软件中心获得发明专利“一种图像分类模型剪枝方法、装置、电子设备及存储介质”

         

         2023年10月27日,上海软件中心获得“一种图像分类模型剪枝方法、装置、电子设备及存储介质”的专利授权,专利号为ZL 2022 1 1269688.4。


          深度神经网络模型在诸多人工智能领域,例如计算机视觉、自然语言处理、强化学习等都有着极佳的表现效果。随着深度学习算法的不断改进,深度神经网络模型的深度也在不断上升。但随之带来的就是上千万甚至数亿的参数量,在实际训练过程中,对算力、存储、延迟等都提出了一个巨大的挑战,大模型主要部署在后端高算力服务器上,而目前边缘计算的需求越来越多,冗余的参数量及模型大小会造成发热、空间不足等问题。基于深度学习的图像分类模型可以应用在诸多下游任务上,但是目前图像分类模型常部署在智能终端上,这需要其具有低存储、高性能、低能耗等特点。本发明提供了一种适用于图像分类便携式智能终端的图像分类模型剪枝方法、装置、电子设备及存储介质,能够提高图像分类模型训练性能和训练效率。


         本发明公开了一种图像分类模型剪枝方法、装置、电子设备及存储介质,涉及人工智能领域,该方法包括获取训练T个周期后的待剪枝的图像分类模型的参数序列;参数序列包括T个网络参数集合;网络参数集合由训练一个周期后的待剪枝的图像分类模型的网络参数组成;利用累计变化算子对参数序列中的网络参数变化进行统计,得到T个周期内网络参数的累计变化数组;根据累计变化数组和参数序列对图像分类模型进行参数剪枝或参数冻结,得到稀疏神经网络模型;将稀疏神经网络模型部署至图像分类便携式智能终端。本发明能够提高图像分类模型训练性能和训练效率。



版权所有 ©2021. 上海计算机软件技术开发中心 All Rights Reserved 沪公网安备 31011202012393号,沪ICP备14033306号-25