對于落地應用正在端側呈現出巨大需求,百度大腦語音團隊研發出一款針對遠場語音交互打造的芯片--百度芯片。芯片采用"軟件定義芯片"的全新設計思路。該芯片采用雙核HiFi4架構,2.8M大內存,臺積電40nm工藝,在此硬件規格上,100mw左右平均工作功耗,即可支持遠場語音交互核心的陣列信號處理和語音喚醒能力。同時,按照車規級標準打造的芯片,可為車載語音交互,以及智能家居等場景帶來更大想象力。芯片流片的同時,即實現了量產。
百度視覺技術部、增強現實技術部總監,5G時代,越來越多物理設備將連接到高可靠、低延時的網絡空間,這將徹底改變人們與環境及設備的交互方式。本次全新發布視覺語義化平臺2.0,正在推進視覺技術由"看清看懂"向"交互"進行升級。視覺語義化平臺2.0在交互升級和軟硬件結合兩大方面實現突破。
交互升級包含一體化人機交互系統和大場景物理世界交互系統。簡單而言,一體化人機交互系統是人與機器、虛擬環境的自然交互與融合,該系統適用于實現AR特效的直播、小視頻、特效小程序等場景,已應用于百度多款視頻App.大場景物理世界交互系統是將視覺定位與AR技術突破性結合,實現大范圍的虛擬信息與物理世界的精準疊加,從而建立起AI時代全新的交互系統。
視覺語義化平臺2.0更新了許多先進的感知技術,也讓機器人技術實現新突破。百度三維視覺首席科學家楊睿剛介紹,機器人就是一個智能體,除了感知技術,智能體需要決策和動作相關的技術,實現從環境感知到主動感知。
目前,百度研究的智能體技術主要集中在自動駕駛Apollo、工程機械和服務機器人三大方面。上午主論壇中引人關注的機械臂"茶博士"不僅能說會道,還完成了傳統的長嘴壺倒茶工作,其背后依靠的正是服務機器人方案。