金融界2024年8月4日消息,天眼查知识产权信息显示,广州尚航信息科技股份有限公司取得一项名为“一种针对智算场景下的网络加速方法“,授权公告号CN118093480B,申请日期为2024年4月。
专利摘要显示,本发明涉及一种针对智算场景下的网络加速方法,包括,获取当前智算场景中pcie物理上的拓扑结构,基于所述拓扑结构解析出GPU与IB网卡的拓扑关系;从所述拓扑关系中筛选出和IB网卡在同一个pcieswitch下的GPU,与IB网卡不在同一个pcieswitch下的GPU定义为其余GPU;于其余GPU中任意一个GPU上运行一个客户端Client;于和IB网卡在同一个pcieswitch下的GPU中任意一个GPU上运行一个服务端Server;以服务端Server作为中转站,基于中转站实现客户端Client到IB网卡之间的数据交互,即实现与IB网卡不在同一个pcieswitch下的GPU将显存直接mapping到IB网卡。本发明既可以利用IB网卡的GDS超能力,提高通信带宽,实现GPU和IB之间的高速通信,也解决了由于通信速率不一致导致pytorch进程会hang住或stall住的问题。
本文源自金融界