專業下載站,下載軟件就到188下載站

188軟件園

您的位置: 188軟件園>資訊頻道>智能科學

他比蘋果還早研發出光學防抖,現在卻加入做“機器人眼睛”的創業大軍

他比蘋果還早研發出光學防抖,現在卻加入做“機器人眼睛”的創業大軍

17-04-27 | 作者:陌路 |

       188軟件園【新智造】按:SLAM 技術最早被用于核潛艇的海底定位,近年來逐漸進入民用領域,尤其是掃地機器人在消費市場的推廣,使得SLAM作為機器視覺的解決方案,備受重視。基于三維視覺的 vSLAM 技術也被廣泛應用與機器人、VR、自動駕駛等智能設備上。本篇文章為188軟件園新智造頻道 SLAM 專題的其中一篇,對初創企業遠形時空的報道,主要介紹了其用于智能設備的視覺感知傳感器和配套的軟件解決方案,以及創始團隊對于市場、技術的看法。

       188軟件園正在啟動“新智造成長榜2017”評選活動,我們將對人工智能與機器人行業進行大規模報道、梳理和調研,并聯合數十家著名投資機構根據這些創新公司的技術實力、商業能力和成長性進行深度評選,最終從多個領域分別選出一些極具潛力成長性的創新公司。

他比蘋果還早研發出光學防抖,現在卻加入做“機器人眼睛”的創業大軍

華中科大光電子專業畢業后,李昌檀先后在索尼、飛利浦、聯想等大廠里工作了十幾年,具體工作略有差別,但核心一直沒變,那就是圍繞“光電子”,做手機攝像頭的系統、硬件、底層軟件和集成。

在這個行當里,李昌檀取得了不少成績,比如在 iphone 還沒有光學防抖功能的時候,他做了中國第一款光學防抖手機,雖然由于各種原因,賣的并不好。十多年的研究,李昌檀希望自己能站在更高的維度上來看產品,他想知道用戶真實的需求是什么,也想知道如何能做出有用的產品,但大廠分工細致,層級嚴格,已經無法滿足他的需求。

于是,2014年李昌檀開始了第一次創業,作為初始團隊加入了一個 VR 公司 。這次創業最大的收獲,就是讓他結識了黃石生博士。黃石生畢業于清華大學計算機系,師從計算機圖形學領域的胡事民教授,在過去一直專注于圖像與視頻等媒體的研究,在圖形學與視覺領域的頂級學術會議(SIGGRAPH/SIGGRAPH Asia/TVCG)上,發表過四篇文章。

相識一年之后,李昌檀聯合黃博士,創辦遠形時空,開始了第二段創業生涯。李昌檀對188軟件園新智造說:

我們要做一些有用的事情,技術門檻高,是一門手藝活,有很多坑,需要一個一個爬出來,不是模式的創新,也沒有很大的杠桿。

這個手藝活,就是基于視覺的 vSLAM 軟硬件解決方案。在李昌檀看來,原先做的手機,現在流行的VR、無人車、無人機等沒有本質的區別,都是用于人機交互的一個工具,底層技術是相通的。但有個區別在于,原先做相機,主要是讓人看,現在是要讓機器能夠看懂。

188軟件園新智造了解到,SLAM 技術的全稱為simultaneous localization and mapping ,即實時定位及地圖構建,SLAM 并不是一項新技術,國內外都有數十家公司在研究。黃石生介紹說,無論是定位還是地圖,分開做都不是難事,難點在于結合,同時要保證即時。

SLAM 不僅僅是一項技術,其實更是一個包含傳感器和算法實現的系統。在傳感器方面,可以選擇的比較多,比如激光雷達、攝像機、視覺里程計、GPS等,主流的是激光雷達和攝像機。

有了傳感器感知環境之外,還需要算法實現,讓機器“看得見”。遠形時空選擇的解決方案是攝像頭+慣性導航+算法。黃石生認為,這樣的解決方案,有以下幾個優勢:

    小型化

    雖然激光雷達精度可以達到毫米級,但在工程上無法小型化,尤其是旋轉式的激光雷達。從目前在自動駕駛領域的實現來看,都需要給激光雷達預留很大的空間,在 VR/AR 等小型設備上,幾乎沒有用武之地。

    成本低

    激光雷達成本相當高昂,旋轉式的激光雷達成本在8000-80000美元之間,固態雷達相對便宜不少,但相比攝像頭還是非常昂貴,這對于廠商來說,成本很高。

    響應頻率高

    激光雷達的響應頻率不如攝像頭,可以輕松達到50-60赫茲,慣性導航則更高,可以達到1000赫茲,這樣輸出信息時就非常快。

    擴展性強

    使用攝像頭的解決方案,除了用來實時定位構建地圖外,用戶還可以利用它擴展其他功能,比如人臉識別、手勢等其他視覺識別的功能。

    特別就 VR 領域而言,現有的視覺解決方案都是由外而內的追蹤,比如通過 Lighthouse 和 Constellation 的高精度追蹤系統,而遠形時空提供的 SLAM 解決方案,則不需要配合,是一體化的解決方案。

    但以攝像頭為主的解決方案采集到的信息量大,背后需要配套非常強大的算法來進行處理。經過李昌檀和黃石生的努力,在雙目 SLAM 和單目 SLAM 兩方面,算法和性能都有了非常大的提升。

    在vSLAM學術研究方面,有很多優秀的工作,有的已經開源(例如ORBSLAM、LSD-SLAM、OKVIS、DSO、ORB-VIO、SVO等),為追求準確性這些方法往往采用計算強度很高的視覺優化(Bundle Adjustment),導致計算功耗很難降低,而純視覺的 SLAM 往往受光照條件、高速旋轉運動、抖動等等影響而產生不穩定,因此,這些方法在產品化在實際產品化過程中有較大難度。

    遠形時空推出的雙目 SLAM 和單目SLAM ,不僅僅依靠攝像頭,還輔助慣性傳感器(即 Visual-Inertial SLAM),很大程度上克服了純視覺SLAM的缺點。另外,為提高穩定性和精度,遠形時空團隊在傳感器硬件、慣性輔助的圖像特征追蹤、丟失重定位等核心技術方面都做了優化,提高了 vSLAM 的穩定性和精度。

    遠形時空團隊推出的雙目SLAM和單目SLAM的精度均在厘米級,drift 小于1%,而計算功耗很小,比同類產品減小超過至少一半以上的計算量,最低時只是1/4左右。

    在機器視覺領域,其實存在著眾多玩家,比如百度前日剛收購的硅谷公司 xPerception,其定位和業務范圍與遠形時空非常類似,國內還有格靈深瞳、速感科技、Human+、拓視覺等初創企業。面對競爭相對激烈的市場,李昌檀認為:

    其實我們也看到一些比較優秀的創業團隊,我們覺得非常好,大家能夠一起教育市場,把這個市場做大。而且,暫時還沒有一個可以通吃產品,我們非常希望做一個能用在很多領域的產品,但實際上還不存在通用的解決方案。所以,無論競爭是否激烈,必須得在某一個細小的領域扎根下來,再拓展更容易一些。

    目前,遠形時空基于這種解決方案,做出了一個嵌入式的硬件產品,并將首先在 VR 領域進行落地,國內外各有一家 VR 廠商已在洽談合作,預計在年內會有進一步消息。現在公司共有10人左右的技術團隊,已完成數百萬的天使輪融資,即將開始下一輪的融資計劃,大概千萬量級。新一輪融資將會用于產品量產、新品研發、團隊擴充三個方面。

 

網友評論

您的評論需要經過審核才能顯示 網名

0條評論>網友評論