当前位置:首页 > 招聘信息 > 正文

华院计算申请视觉Transformer模型设计专利,在较少形变情况下提取更符合原始图像的特征信息

  • 2025-12-29
  • 30

金融界2024年10月31日消息,国家知识产权局信息显示,华院计算技术(上海)股份有限公司申请一项名为“一种视觉Transformer模型设计方法、装置、存储介质和程序产品”的专利,公开号CN118840414A,申请日期为2024年7月。

专利摘要显示,本发明提供一种视觉Transformer模型设计方法、装置、存储介质和程序产品,其中,方法包括:设定最小形变图像的大小和最小区域块的大小;根据原图的宽高,得到原图的长边与短边之比取整的值,确定形变目标图像的一边长和待划分区域块的一边长;根据原图的长边与短边之比取整的值,计算出形变目标图像的宽高和待划分区域块的宽高;根据形变目标图像的宽高和待划分区域块的宽高,对图像进行形变和划分,得到若干区域块,送入Transformer结构中。将每个区域块划分成若干方块,对所述若干方块进行编码,得到每个区域块特征;整合所有的区域块特征,送入Transformer结构中进行训练。本发明可以在较少形变情况下提取更符合原始图像的特征信息。

本文源自金融界

最新文章