8月18日,威邁爾VMR正式發(fā)布人形機(jī)器人頭部模組OmniHead(奧視知腦)。
當(dāng)前,人形機(jī)器人在實(shí)際應(yīng)用中普遍面臨環(huán)境感知能力弱、決策依賴預(yù)設(shè)邏輯的痛點(diǎn),導(dǎo)致難以擺脫人工遙控,制約了實(shí)際應(yīng)用場景的拓展。OmniHead的推出將有效解決這些技術(shù)瓶頸。
OmniHead是威邁爾專為具身智能打造的頭部模組,搭載高精度RGB-D視覺系統(tǒng)和AI大模型。通過OmniHead開發(fā)者可輕松提升機(jī)器人的視覺感知能力和環(huán)境魯棒性,從此擺脫遙操。
01、視覺全景感知
OmniHead的RGB-D深度視覺系統(tǒng)由三組十個(gè)RGB-D陣列相機(jī)組成,分布于頭部模組的正前方、左后側(cè)和右后側(cè),形成360°x90°的全景視野,實(shí)現(xiàn)機(jī)器人在復(fù)雜場景中的定位、感知和自主導(dǎo)航。
視覺定位技術(shù)
OmniHead采用視覺定位技術(shù),通過RGB-D陣列相機(jī)實(shí)時(shí)獲取周圍環(huán)境的三維信息并快速建圖,為機(jī)器人定位導(dǎo)航提供可靠數(shù)據(jù)。
多模態(tài)感知與語義識(shí)別
OmniHead的RGB-D相機(jī)融合語義感知算法,實(shí)現(xiàn)環(huán)境物體類別的精準(zhǔn)識(shí)別,經(jīng)過訓(xùn)練可識(shí)別桌子、椅子、人、機(jī)器人、狗等多類物體,為機(jī)器人行為決策提供準(zhǔn)確依據(jù)。
多機(jī)協(xié)同數(shù)據(jù)同步
三組RGB-D陣列相機(jī)可實(shí)現(xiàn)視覺數(shù)據(jù)同步采集與傳輸,最終獲得全景三維重建與實(shí)時(shí)感知。
02、AI大模型+麥克風(fēng)陣列
深度集成DeepSeek或通義千問大模型和環(huán)形麥克風(fēng),支持360°聲源定位與自然語義理解,實(shí)現(xiàn)多輪對話與情感化響應(yīng)。
環(huán)形麥克風(fēng)陣列6麥協(xié)同降噪,支持5米遠(yuǎn)場拾音,搭配聲紋識(shí)別算法,實(shí)現(xiàn)多人對話場景下的聲源分離與語音增強(qiáng),并且支持中英雙語交流。
03、開放接口多模態(tài)數(shù)據(jù)融合
OmniHead擁有豐富的開放接口,支持視覺、語音多模態(tài)數(shù)據(jù)聯(lián)合推理,適配各類人形機(jī)器人平臺(tái),可拓展具身智能多場景應(yīng)用,包括商業(yè)辦公、智能制造、智能家居、醫(yī)療陪護(hù)等領(lǐng)域。
04、主要參數(shù)
OmniHead是具身智能的“傳感中樞",它的誕生讓機(jī)器人真正具備了人的感知與思維模式,為具身智能擺脫遙操提供可靠的技術(shù)支撐。
OmniHead(奧視知腦) | |
高度210mm;頭圍480mm;脖圍220mm | |
重量 | |
自由度 | 2 自由度:轉(zhuǎn)頭土75° 點(diǎn)頭±45° |
通訊接口 | GMSL |
軟件開發(fā) | ROS2 SDK |
視場角 FOV | 360° x 90° |
分辨率 | 深度: 720x160;RGB: 1920x3240 |
深度測距 | 0.1~18m@10% 反射率室內(nèi) |
測量精度 | 3cm(1σ) |
抗陽光干擾能力 | 100KLUX |
幀率 | 20HZ |
輸出數(shù)據(jù)接口 | Serdes |