> 资讯 > 社会

“负延迟”远控是怎么实现的?硬核解析全新贝锐向日葵的自研技术

人阅读 2025-08-19 17:46:36业界资讯

贝锐向日葵即将推出全新版本,全面升级架构,性能再度飞跃。除了支持4K 144帧、8K 60帧等超高清远控体验外,更令人惊艳的是,全新向日葵能够实现行业首创的“负延迟”显示能力。这一技术突破的背后,则是源于贝锐团队对“延迟”这一物理法则的深度理解与极限挑战。


一、延迟的真相:链路上的每一环,都是延迟的来源

延迟看似抽象,其实在我们生活中无处不在。除了大家经常听到的网络延迟,其实生活中也有很多类似的例子。就比如点外卖,从你下单到骑手把餐送到你手上,这一整段流程也属于是“延迟”。

而且,延迟是由每一个环节共同构成的。如果餐送得慢,可能包含了餐厅接单出餐的时间、骑手在路上的时间、甚至可能还有等电梯的时间。


可以说延迟的本质,恰恰就在于链路上的每一分每一秒。延迟在数字设备中也是如此,不仅无处不在,而且同样是由多个环节共同叠加产生的。

就拿显示器来说,画面的呈现也存在延迟。显卡(GPU)输出视频信号之后,需要经过线缆传输、显示器内部的信号处理,以及屏幕面板本身的刷新动作,最终才可以完成画面的呈现。


远程控制中,画面的延迟问题就更加复杂。因为除了终端设备本身的显示器显示延迟之外,还要叠加远程画面的采集、视频编码、网络传输、本地解码、渲染等多个步骤。


二、远控延迟的三大源头:采集/编码、网络传输、解码/渲染

远控链路的每一环,都有可能成为拖慢整体效率的瓶颈。

比如,远程主机需要实时将显示画面进行采集编码,此环节如果是性能较弱的设备,或者编码器效率低(如软件编码器),就会导致编码过程耗费较多的时间。通常来说软件编码耗时20毫秒至100毫秒,GPU硬件编码则是1毫秒至5毫秒。

同样,本地主机接收到远程视频数据后,还需进行解码。如果本地设备硬件或者解码器性能弱,也会花费较多的时间。

另外,在网络传输环节中,除了带宽大小和网络拥塞(如丢包、延迟波动等)会直接影响传输时间,不同的传输介质、传输距离、传输路径也会带来延迟差异。

光纤的信号传播速度接近光速,传输100公里大约仅需0.5毫秒(不含设备处理延迟),而铜缆(电缆)的信号传输速度则相对较慢,每100公里约需0.6毫秒(不计算中继延迟)。

若中间经过多级路由器、网络交换设备或公网中继节点,也会进一步增加延迟,每经过一个节点至少拖慢大约1毫秒。

在实际场景下,同运营商同城光纤直连,典型延迟在1至5毫秒,跨运营商、跨地区互联(如广州、北京)40至80毫秒,跨国则是高达100毫秒以上。

三、提前看到被控端画面,揭秘向日葵实现远控“负延迟”的原理

那么,贝锐向日葵究竟是如何突破瓶颈做到负延迟的?

向日葵之所以能在新版本中实现“负延迟”,是因为通过远控全链路的深度优化,使“远程视频编码 网络传输 本地视频解码/渲染”这条链路的总耗时,反而小于远程设备本身的显示延迟。

换句话说,在远程设备的画面尚未完成本地显示之前,这一画面已经被完整传输到主控端并提前展现出来。

这个听起来有些不可思议,如果用生活中熟悉的情境来形容,就像是两个人同时在同一家餐厅下单,一个堂食、一个外卖,同时出餐,结果外卖竟然比餐厅服务员把菜端上桌还要更快。

这并不是夸张的比喻,而是在某些特定条件下向日葵的真实表现:在测试环境中,同时主控设备(发起控制的设备)的显示器刷新率高于被控端,主控端设备的显示画面可比被控端提前完成刷新,真正实现了“我比你更早看到你自己”。


这是因为向日葵采用高效的视频编解码方案,采集、编码耗时可低至5毫秒以内,解码耗时则控制在1毫秒以内。在测试环境中,网络延迟也被优化至1毫秒以内,加之主控端使用的240Hz高刷新率显示器,其显示延迟仅约7毫秒,因此整条远控链路的总延迟可以控制在14毫秒左右。


相比之下,被控设备若使用普通的60Hz显示器,其自身显示延迟可能高达20至32毫秒,已经高于向日葵远程控制链路的总延迟。正因如此,向日葵才能实现远程画面在主控端“提前”完成显示的效果,带来“负延迟”远控效果。

四、全链路协同提速:向日葵实现极致低延迟远控的三大核心

事实上,为了达成极致的远控效果,从视频采集/编码、解码/渲染到网络传输环节,向日葵实现了远控链路每个节点的协同提速。

     在编解码架构层面,向日葵采用GPU硬件编解码与Zero-copy(零拷贝)架构,彻底消除视频处理过程中多余的数据搬运步骤,实现毫秒级延迟。

    在算法层面引入自研SADDC编解码技术,智能切片、分区、调帧,兼顾低带宽占用与高清高帧率体验。

    在网络层面布局全球200 高质量节点,结合BGP多线接入、边缘加速与自研低延迟传输协议,确保在复杂网络环境下依然具备低延迟、高清流畅且稳定的远控体验。


4-1.全面引入GPU Zero-copy(零拷贝)架构

首先,在编解码架构层面,对于视频的采集、编码,和解码、渲染环节,向日葵不仅采用GPU硬件编解码,对GPU的各个编解码参数进行最优化调校,并且全面引入了GPU Zero-copy(零拷贝)架构来降低耗时

向日葵可以充分利用GPU的强大性能,在GPU“内部”直接实现画面的采集、编码,或是解码、渲染,不会将数据频繁转存至系统内存再进行计算,也不会在GPU显存中进行不必要的复制。


具体来说,在被控端视频采集阶段,通常这一流程需要预处理一系列必要的图像操作,例如缩放、旋转、光标叠加以及颜色空间转换等。在传统方案中,这些处理往往依赖CPU完成,需要将GPU的视频数据拷贝至系统内存,再由CPU处理,完成后再进行编码,每一次拷贝都有时间消耗,会增加延迟。

向日葵采用GPU Zero-copy架构,所有图像的预处理工作均由GPU完成,并直接交由GPU编码,无需在CPU与GPU之间频繁传输数据,从而有效消除了不必要的耗时。同时,在编码阶段,向日葵对GPU硬件编码器进行了针对性的低延迟参数优化,确保编码器能够在毫秒级内完成视频帧的压缩与输出。

而在主控端视频解码时,许多远控工具,通常会先将画面数据从GPU显存复制到系统内存,再由CPU进行图像处理(比如画面缩放、叠加鼠标轨迹、控制指令、水印覆盖等),完成之后再次送至GPU显存进行渲染。

同样,这种“GPU显存 → 系统DDR内存 → 再回到GPU显存”的数据路径,不仅增加了额外的算力开销,而且由于受限于DDR内存带宽,数据搬运过程也变得十分缓慢。即使部分远程控制工具避免了将视频数据回传至系统内存,仍有可能涉及转换渲染,会有额外操作时间,依然会引入延迟。

相比之下,向日葵通过引入GPU Zero-copy架构,在解码渲染阶段彻底避免了不必要的内存数据复制和搬运,大幅降低时间消耗。向日葵的所有图像处理任务均在GPU内部完成,并直接提交渲染,极大压缩了解码与渲染的耗时,延迟甚至低至1毫秒以内,几乎可以忽略。

值得一提的是,得益于GPU强大的并行计算能力,向日葵不仅实现了使用GPU进行画面缩放、鼠标轨迹叠加、控制指令展示、水印覆盖等常规图像处理,还能够在此基础上,利用GPU的强大算力,提供更多的复杂处理,比如进一步引入AI超分辨率算法等,为画质提升提供解决方案。

4-2.针对远控场景优化,自研专利视频编解码算法“SADDC”

其次,向日葵的视频编解码算法方面也有针对性进行优化。作为首款自主研发的国产远程控制软件,向日葵使用了具有发明专利的“SADDC”自研视频编解码算法

不同于绝大多数远控软件使用通用的视频编解码算法,SADDC算法能够针对远控场景,进行视频编解码的实时细颗粒度优化,兼顾低网络带宽占用、低延迟、高清、高帧率画面的传输。


SADDC会对画面进行智能切片、分区,根据画面复杂程度甚至可以细化到上万个区块,并基于Visual Saliency视觉显著性算法,智能判断画面变化情况,对画面有变化的区块进行重新计算、压缩,并进行传输,同时为用户视觉焦点区和显著区分配更多数据量,在有限数据量的情况下获得更好的主观体验。

如此一来,向日葵解决了通用编解码算法压缩整个画面会产生大量冗余数据的问题,并大幅降低了算力需求。

此外,SADDC算法不仅能将画面智能切片压缩、计算,而且还会智能判断画面的变化幅度,如果画面中不存在大幅运动物体(如文字编辑、查看静态图片),自动降低帧率,最低可无感调节至1帧或是暂停画面刷新。

例如:用户没有任何操作时的静态桌面就会采用1帧、普通办公场景可能是15帧,视频播放时则是30~60帧,确保流畅度的同时,进一步降低了传输数据量。

4-3.布局全球200 高质量节点,自研的低延迟传输协议

最后,在网络传输层,向日葵在全球范围内部署了超过200个高质量接入节点。其网络架构采用BGP多线接入策略,能够智能识别并选择当前电信、联通、移动三网中延迟最低、最优质的链路,避免跨网、跨区域访问带来的高延迟和丢包问题。

同时,向日葵在靠近用户的网络边缘部署加速节点,大幅减少了长距离传输对响应速度的影响。在链路层面,一旦系统检测到当前链路存在延迟升高或丢包现象,便会自动切换至备用链路。

更进一步,向日葵还采用自研的低延迟传输协议,以及贝锐自研Oray-Raptor混合低延迟算法,通过引入自研的混合FEC(前向纠错编码)等技术,具备了更强的抗丢包、抗抖动能力,进一步提升了在复杂网络环境下的远控稳定性。

五、不仅是挑战技术极限,更是向日葵对用户体验的重视

这样的极致优化,不只是为了挑战延迟的极限,是源于向日葵团队对用户体验的重视。

实际上,不同的应用场景对延迟的容忍度存在明显差异。对于需要高频交互和实时操作的场景,比如远程3D建模、视频剪辑等,超过50毫秒的延迟就会被用户明显感知。远程播放视频剪辑内容时,画面稍有滞后,就会影响时间轴的精确定位,导致实际剪辑位置发生偏移,难以保障剪辑与编辑的精准性。

工业物联网领域,异地监控和远程操作HMI界面时,将延迟控制在100毫秒以内,能够带来接近本地的“即时响应”体验,大幅提升操作效率,同时不会因为设备实时运行数据滞后,导致错误的判断和操作。

而在远程医疗手术指导、远程教学等场景下,延迟需尽量低于200毫秒,否则音视频的不同步会导致专家指令与实际操作产生错位,严重影响指导的准确性和安全性。

正是向日葵与大家深入探讨,了解远程控制在各行各业实际应用,以及其中所面临的瓶颈与痛点后,向日葵才持续深耕并不断打磨远控全链路的技术能力。从视频编解码优化、网络传输加速,到多端设备适配与安全保障,向日葵针对每一个影响远控体验的关键环节进行了创新和技术突破。

正因为具备强大的全链路技术能力,向日葵的远控解决方案被广泛应用于远程办公、工业运维、医疗影像、智慧教育等多个关键行业场景。向日葵不仅被企业和机构用于了业务核心流程,帮助大家解决了远程作业与异地协作的难题,也为各行业数字化转型注入了新动能,推动生产力的持续跃升。未来,向日葵将持续以技术创新赋能行业变革,为用户创造更具竞争力的价值和更广阔的发展空间。

LOT物联网

iot产品 iot技术 iot应用 iot工程

Powered By LOT物联网  闽ICP备2024036174号-1

联系邮箱:support1012@126.com