—
近期,亞馬遜發(fā)布了幾款全新的Echo,新Echo可以更快地處理Alexa請求,同時還有一款配備了10.1英寸的顯示屏。 從當下智能音箱上市的趨勢來看,消費者對智能音箱“語音識別的響應速度”、“強外噪、超大功率音樂播放環(huán)境下的喚醒率”,“隱私”,“語音、視覺識別、觸屏、SLAM多模態(tài)交互”的要求,都在日益提升。 未來,在智能語音處理器中,如何具備:實時的精準語音識別、多模態(tài)交互、更出色的高級音效與差異化,是該領域的關鍵發(fā)展點。
1全志預研,與發(fā)展趨勢不謀而合兩年前,全志預判到了智能語音趨勢的發(fā)展,提前規(guī)劃了專為“語音識別深度學習算法”而打造的全新處理器 —— R329。R329提供了一種全新的語音識別硬件加速神經(jīng)網(wǎng)絡,支持int8、int16混合精度流式處理,從而可以在更快地處理請求,語音識別體驗更快,平均響應時間從2秒左右減少到200毫秒以內,這是一個不容小覷的提升。R329同時具有同類優(yōu)秀的能源效率,能源消耗減少了25倍,語音處理速度提高了30倍。
核心客戶體驗R329 得益于R329本地端側語音識別深度學習算力幾十倍級的提升,R329的核心品牌客戶正逐步建立起以語音識別為核心的安全系統(tǒng)解決方案。比如在智能家居場景,R329可以檢測各種聲音做出智能反應;比如聽到嬰兒的哭聲時智能開燈并提醒寶媽;比如主人設定外出期間在室內檢測到開關門聲、腳步聲自動發(fā)出報警聲和信息提醒等等。 2帶屏智能語音處理器R818與此同時,全志也規(guī)劃了一顆可帶屏的智能語音處理器R818。
核心客戶體驗R818 得益于R818本地端側深度學習算力,相較于CortexA35高達七成的提升的同時,功耗、溫升還出現(xiàn)了明顯的降低。R818的核心品牌客戶可以獲得持續(xù)、穩(wěn)定的高算力輸出,從而逐步建立起更具人性化的語音識別、視覺識別、觸屏多模態(tài)的智能感知交互。比如在智能家居場景,R818可以在小神獸在線觀看超清動畫片的同時,通過人臉檢測自動進入兒童模式,過濾成人內容,通過童聲語音,識別圖文并茂的回答寶寶們所提出的十萬個為什么,通過攝像頭深度學習的坐姿檢測培養(yǎng)小神獸良好的坐姿習慣等等。 3非云端,本地實現(xiàn)關于亞馬遜此顆新處理器其能源消耗大大減少、語音速度大幅提升,這些改進,都得益于處理本身是在設備上完成的,從而消除了將查詢發(fā)送到云的需求。
而目前智能語音識別趨勢來看,不上傳云端,本地實現(xiàn)語音識別是更有效的解決方案。R329/R818不僅也能大幅提升設備端的語音識別能力,同時還能實現(xiàn)本地的語音識別,不需要上傳云端、在本地即可實現(xiàn)各種方言命令的識別,響應時間從2秒降低到200毫秒以內。
同時,R329/R818處理器還可實現(xiàn)離線IOT控制,比如控制空調、燈、掃地機、油煙機、加濕器、窗簾等,且同時支持多種方言的交互,講粵語的丈母娘和講四川話的老媽都可以自然語言交互。 目前,R329與R818都已成功導入到部分中國Top3的智能音箱客戶,未來,全志科技將在智能語音識別領域持續(xù)發(fā)力,為用戶帶來更高效率的高準確率的語音識別體驗。
R329芯片規(guī)格介紹
集成雙路AUDIO DSP HIFI4,硬件支持32位浮點的高精度前端、后端數(shù)字信號處理算力;
集成AUDIO專用NPU,支持160 MACs,語音識別專用深度學習算力超過200GOPS;
集成雙核CortexA53 1.5GHZ,提供生態(tài)配套成熟、完善的用于系統(tǒng)、應用和網(wǎng)絡連接開發(fā)的高效算力;
集成高達2MB的SRAM,搭配HIFI4實現(xiàn)50毫瓦雙麥遠場格可喚醒的超低功耗;
集成高達256MB的DDR3,為LOCAL ASR、LOCAL NLP、LOCAL TTS等語音識別深度學習算法提供充裕的高容量、高帶寬的內存支持。
R818芯片規(guī)格介紹
32位、64位浮點運算單元相較于CortexA35提升一倍,傳統(tǒng)信號處理算力提升60%以上;
8位、16位定點、整數(shù)運算單元相較于CortexA35提升一倍,深度學習算法算力提升70%以上;
HPC+制程工藝相較于同級別SOC的LP制程工藝CPU電壓下降20%,CPU峰值運行功耗降低40%;
出眾的視頻編解碼能力 (4KP30 H.265Decoder,1080P60 H.264 Encoder) ,完美滿足客戶的視聽盛宴需求;
集成豐富外設計口(2路同步并發(fā)MIPI CSI、IR、EMAC、6路uART、LEDC、4路I2S/TDM等),完美匹配各類行業(yè)方案需求。
原文標題:不僅可視,也讓語音識別更快更有效 —— 全志R系列智能語音專用處理器
文章出處:【微信公眾號:全志科技】歡迎添加關注!文章轉載請注明出處。
責任編輯:haq
-
處理器
+關注
關注
68文章
19899瀏覽量
235405 -
語音識別
+關注
關注
39文章
1782瀏覽量
114256
原文標題:不僅可視,也讓語音識別更快更有效 —— 全志R系列智能語音專用處理器
文章出處:【微信號:Allwinnertech,微信公眾號:全志科技】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
基于米爾全志T536開發(fā)板的視頻識別應用方案

帶專用協(xié)議硬件 + R-IN引擎的微處理器RZ/N1L系列數(shù)據(jù)手冊

恩智浦i.MX 94應用處理器如何變革工業(yè)和汽車連接
有獎丨米爾 全志T536開發(fā)板免費試用

Made with KiCad(十六):全志RISC-V 64 SoC F133/D1s開發(fā)板

Cortex-A55 處理器到底什么來頭?創(chuàng)龍教儀一文帶您了解
恩智浦發(fā)布i.MX 94系列應用處理器
米爾國產(chǎn)全志T536系列核心板開發(fā)板-產(chǎn)品手冊
國產(chǎn)全志T536系列-國產(chǎn)工業(yè)級-米爾核心板開發(fā)板
基于全志T113-i多核異構處理器的全國產(chǎn)嵌入式核心板簡介
基于全志V853處理器的智能輔助駕駛算法介紹

OMAP5912應用處理器數(shù)據(jù)表

評論