快捷导航
关于我们
机械自动化
机械百科
联系我们

联系我们:

0431-81814565
13614478009

地址:长春市高新开发区超越大街1188号
传真:0431-85810581
信箱:jltkxs@163.com

机械自动化

戴上眼镜就能控物!俄罗斯团队让机械臂“秒懂

发布时间:2025-10-29 09:46

  

  想象一下,你只需要看一眼杯子,再看一眼桌子的另一边,机械臂就会把杯子放到那里。这波操做不是来自科幻片子,而是来自俄罗斯斯科尔科沃科学手艺研究院(Skoltech)最新研发的GazeGrasp系统。这个系统最大的亮点是:完全不需要脱手,仅凭眼神就能切确节制机械臂抓取和放置物体。对于患有严沉活动妨碍的人群来说,这无疑是一个。值得一提的是,研究团队通过引入磁吸效应功能,让系统的操做效率提拔了31%。13名测试者的尝试数据显示,有了这个功能后,用户锁定方针物体的平均时间从6。77秒缩短到了4。65秒。要让机械人看懂你的眼神,可不是一件容易的事。GazeGrasp系统巧妙地整合了多项前沿手艺:起首是眼动逃踪硬件。研究团队开辟了一副特制眼镜,拆载了ESP32 CAM摄像头模组。这个玲珑的设备可以或许及时捕获用户的眼球活动,并通过无线收集传输数据。其次是深度进修算法矩阵。系统采用了谷歌的MediaPipe框架来检测和逃踪面部特征点,出格是虹膜的。这项手艺可以或许正在各类光照前提下不变工做,确保眼动逃踪的精确性。同时,YOLOv8方针检测模子担任识别工做区域内的物体。它能及时标注出杯子、刀具、瓶子、手机、鼠标等常见物品的,并为每个物体生成鸿沟框。研究团队的处理方案是引入磁吸效应。当用户的视线接近某个物体的鸿沟框时,光标会从动吸附到物体核心。这就像磁铁吸引铁块一样,大大降低了切确瞄准的难度。具体来说,当视线进入物体鸿沟框时,系统会施行以下逻辑:若是正在鸿沟框内,鼠标会从动调整为物体核心坐标;不然,连结原始视线。这个看似简单的功能,却让操做效率提拔了近三分之一。让机械人精确抓取物体,还需要处理一个环节问题:若何将屏幕上的像素坐标转换为机械人工做空间中的实正在坐标。GazeGrasp系统采用了细密的坐标转换算法。起首,用户需要进行一次性的校准流程。系统会正在屏幕上显示35个预设点,用户顺次凝视这些点,让系统进修眼球活动取屏幕坐标的对应关系。研究团队利用了三次多项式回归模子来成立这种映照关系。通过这个模子,系统可以或许将ESP32 CAM捕获到的虹膜坐标精确转换为屏幕坐标。为了消弭眼动数据中的噪声,系统还集成了卡尔曼滤波器。这个典范的信号处置算法可以或许滑润原始的眼动轨迹,让光标挪动愈加不变流利。这涉及到相机的内参和外参标定,以及逆投影变换。对于平面工做台,这个过程能够简化为一个单应性矩阵变换。整个抓取流程是如许的:用户凝视方针物体3秒钟,UR10机械臂就会挪动到物体并用Robotiq 2F-85夹爪抓取;然后用户再凝视空白3秒钟,机械臂就会把物体放置到那里。全程无需任何手动操做。正在尝试评估中,研究团队邀请了13名春秋正在21-37岁之间的意愿者(5名女性,8名男性)参取测试。每位参取者需要完成40次物体定位使命,别离正在有无磁吸效应的环境下进行。统计阐发显示,磁吸效应的引入发生了显著的统计学差别(F(1,24)=24。52, p0。001)。但GazeGrasp的意义远不止于此。它代表了人机交互的一个立异标的目的——完全基于天然的心理信号进行节制,无需进修复杂的操做体例。对于患有肌萎缩侧索软化症(ALS)、脊髓毁伤或其他严沉活动妨碍的患者来说,如许的系统可以或许帮帮他们从头获得糊口的能力。想喝水时看一眼水杯,机械臂就会成为他们的手。除了医疗康复范畴,这项手艺正在工业从动化、近程操做、功课等场景也有广漠的使用前景。好比正在核电坐、深海探测、太空功课等场景中,操做员能够通过眼动节制机械人完成精细操做,同时解放双手进行其他使命。研究团队暗示,将来将继续优化系统,包罗提拔正在复杂下的鲁棒性、添加避障功能、扩展可识别物体类型等。跟着手艺的不竭完美,用眼神节制机械人大概会像今天用鼠标键盘一样天然。