原創智能音箱的戰場,卻成了這家公司的紅利收割場:情侶生活

時間:2023-11-21 11:08:48 作者:情侶生活 熱度:情侶生活
情侶生活描述::智能音箱的戰場,卻成了這家公司的紅利收割場 文/許夢 編輯/單一 2015年京東和科大訊飛合資成立的靈隆科技,推出第一臺中文智能音箱。到現在國內智能音箱大戰已然戰旗烈烈。 今年天貓精靈、小米AI音箱相繼宣布銷量突破1000萬臺大關,百度也傳出2019年智能音箱的KPI是1000萬臺。 從占據市場前三的小米小愛、百度小度、天貓精靈魔盒,到華為智能音箱、聯想音箱、騰訊王者榮耀智能機器人……在這場音箱鏖戰背后,卻有一家共同的遠場語音技術服務商——聲智科技。 他們主要為B端用戶提供SoundAI Azero智能操作系統和服務,以及深度結合應用場景的人工智能技術和產品解決方案,并擁有聲學傳感陣列,遠場聲學處理,遠場語音喚醒,遠場語音識別,遠場雙工通話,遠場聲紋識別等自主核心技術。 我們平常使用的智能音箱的智能交互服務大多是聲智提供技術支持。可以說,聲智科技是伴隨著智能音箱賽道興起應運而生的。 使用SoundAI Azero智能操作系統的產品 時間倒回三年前,市場并沒有多少人看好語音交互。“那時候大家覺得人臉識別會更好,因為它涉及到安防,政府會有一定的需求。”聲智科技創始人、董事長兼CEO陳孝良說。 圖像光靠人臉識別就可以重金賣出,相比之下,語音從收集聲音、降低環境干擾到識別口音和方言、轉化文字等,技術鏈條過長,而且交互落地場景匱乏,市場前景不明。 但陳孝良認為,聲音可以解決人跟物的連接問題,這是個更大的市場。從中科院聲學研究所出來,從語音識別領域切入,他創辦了聲智科技。 語音識別技術,就是為了讓機器人聽明白人在說什么。語音識別是讓機器通過識別和理解,把語音信號轉變為相應的文本或命令。通俗來說就是給機器裝上耳朵,讓機器聽懂人類語言,實現人與機器交流。 遠場語音識別是通過麥克風陣列前端處理算法,即使在三至五米的距離說話也可準確識別。而近場語音識別,主要指手持設備近距離語音,比如輸入法中的語音輸入。 彼時,行業普遍的技術思路是從近場過渡到遠場,在近場環境中加一些模擬噪聲、模擬環境等。 從中科院副教授辭職創業,陳孝良對于方向想得明白。他認為,遠場語音交互是未來人機交互的趨勢之一,聲智直接就是做遠場語音交互。和不少AI公司一樣,聲智剛開始也是從安防領域切入。 當時,360也正在尋找一個能解決攝像頭遠場語音問題的技術服務商。很多攝像頭雖然能錄像,但是攝像頭距離一拉遠,收音含混不清。當360找到他們,雙方一拍即合。聲智抓住這一市場痛點進行針對性研發。成立3個月后,聲智提供技術支持的首款語音安防產品——奇虎360小水滴智能攝像機正式上線。 奇虎360小水滴智能攝像機 “攝像頭銷量很好。”陳孝良告訴鋅財經。第一個訂單不僅吸引來了360這個重要客戶,后來360也成為第一波押注聲智的股東。2016年5月,聲智拿到了峰瑞資本、奇虎360、潤浙資本的上千萬天使輪融資。 如果說和360的合作是試水成功,那么成為小米音箱遠場語音交互方案的唯一供應商,讓聲智一炮打響。 2016年8月,小米聯創王川來聲智考察技術。彼時,陳孝良團隊已經做出了智能音箱模型。 在硬件上,聲智科技憑借聲學信號方面的技術積累,研發出單麥、雙麥、4麥克風陣列、6麥克風陣列和8麥克風陣列等。其中麥克風陣列集成了全方位喚醒、聲源檢測、定向拾音、噪音擬制、混響消除、回聲抵消、聲紋識別等多項技術。 據陳孝良介紹,小米AI音箱包含6麥環形陣列技術和遠場喚醒技術,具有Dual-wake、Free-cut、One-shot等獨有的定制功能。而在小愛音箱mini上,聲智提供了4麥遠場語音交互技術,解決了小型智能音箱體積較小(麥克風陣列與大音量喇叭相距很近)、低成本喇叭失真較大的技術困難。 小米AI音箱 智能音箱為聲智在人工智能硬件領域撕開了一個口子。隨后,百度、阿里、聯想、華為等客戶紛至沓來。 為什么選擇一個成立不到兩年的初創公司作為技術提供商?陳孝良認為,靠的是技術的黏性。語音交互技術不斷迭代,只有跑在前頭了,才有后邊客戶的積累、數據積累以及市場規模的積累。 在語音交互的領域,除了單點實驗的突破外,最重要的是規模化驗證。誰最先實現規模化,誰就會占領先機。 聲智是通過使用麥克風陣列及相關算法,對目標說話人的聲音進行遠場增強并匹配遠場語音識別。在技術落地之初,很多廠商設備的芯片、傳感器與其麥克風陣列并不兼容。 聲智的解決方案是最大限度屏蔽芯片的差異化,通過算法處理芯片、傳感器、麥克風陣列不一致性的問題,以此實現產品的規模化。 “廠商在芯片上要支持你,傳感器也要支持你的算法,要實現兼容,需要推動整個產業鏈條。”陳孝良提到。他回憶那段日子,每天游說于芯片廠商、傳感器廠商之間,說服他們進行產品升級。通過算法的更新優化減少對硬件的依賴,進而降低芯片成本,設備的成本也得以迅速降下來。以智能音箱為例,其價格從一上市的上千元已經降至現在幾百元。 在橫向上,陳孝良團隊不再滿足于做單點語音硬件突破,開始在各種各樣的設備以及應用場景中實現智能語音功能。也就是說,無論是什么智能設備,不管用在哪個場景里邊,都能嵌入智能語音應用。 從攻堅單點技術,到追求底層架構泛化, SoundAI Azero智能操作系統問世。這是一套底層AI OS,在該系統上,企業可根據自己的需要可進行二次開發。 “作為技術產業鏈條中的一環,那我們就希望提供一套通用的,能夠支持二次開發的,能夠兼容更多設備和場景的AI操作系統,讓客戶在上面去開發他們邏輯以及開發自己的產品。”陳孝良說。 在這套通用交互系統里,無論設備是帶屏使用還是語音操作都可以,交互方式兼容。 Azero系統默認集成信息查詢、影音娛樂、LOT控制 等200+項常用技能與服務 圖片來源于受訪者 智能音箱之后,聲智也將范圍拓展至智能電視、機頂盒、智能衛浴等智能家居領域,在汽車、安防、金融、教育、醫療、機器人等行業,都看到了SoundAI Azero智能操作系統的身影。 他們服務的客戶規模也越來越大、title也越來越響,華為、小米、百度、騰訊、阿里、中國移動、中國聯通、中央人民廣播電臺、聯想、創維、寶潔、萬科、奇虎360、金蝶、浪潮、國美……聲智已然在遠場語音交互占據大半江山。 陳孝良沒有放慢節奏,而是加快了腳步,面對一直在變化的市場,陳孝良和他的團隊隨時出擊。 鋅財經 作為2016年剛做的初創公司,這些大廠會為什么要選擇你們? 陳孝良 有很多個方面的因素。首先,比較重要的是公司的戰略定位以及在市場中的合作態度。 我們把自己定位為ToB的、做操作系統和技術服務的公司,專注做好遠場語音智能技術服務商的角色,為行業客戶提供最優秀、最前沿的智能交互服務。其次,技術的不斷迭代和領先,這是技術公司的根本出發點。 在技術的規模性驗證上,聲智在規模化驗證時付出了極大的努力,同時在產業鏈中也做了很多的工作。例如,智能音箱能快速地批量生產,需要用技術解決傳感、芯片的技術升級以及它們之間的差異化問題,包括智能音箱的揚聲器、麥克風陣列、聲學結構和ID設計的問題。聲智在規模化量產中和很多上下游產業鏈進行合作,并依靠聲智獨特的工程能力去輔助支撐。 鋅財經 作為公司的核心產品,SoundAI Azero是如何解決行業的通用問題的? 陳孝良 SoundAI Azero是聲智科技基于全球領先的遠場語音交互技術為企業、個人及第三方開發者免費開放的全鏈條AI操作系統。這是一套集成遠場喚醒、波束形成、聲源測向、噪聲抑制、混響消除、回聲消除、端點檢測、語音識別、聲紋識別、語義理解、語音合成、雙工通話、自然語言處理、聲波配網等技術的人機交互系統。 我們希望Azero能夠連接有價值的信息、服務與設備,讓智能語音技術安全應用到我們生活、辦公、出行的各個場景,支撐電信、金融、教育、醫療和電力等行業應用,并支撐國內人工智能芯片行業的自主研發和產業落地,為多種場景和設備提供高效的人機交互和智能決策能力。 用一句話來說,Azero智能操作系統就是讓每一臺機器都更加智能,而且更加快速獲得智能交互能力。 鋅財經 你們已經在這個領域里占據了一定的市場份額,下一步的計劃是? 陳孝良 專注于智能操作系統以及用戶體驗的不斷提升,這是我們從成立到現在一直堅持的,并且也會長期專注這個目標并不斷地迭代下去。 目前我們聲智正在不斷加大在聲學和人工智能技術方面的研發投入,我們將努力保持與美國同類技術研究的同步,并在某些單點技術方面超越美國,力求用全球最好的技術服務全球客戶,并推動國內產業鏈的轉型升級。
站長聲明:以上關於【原創智能音箱的戰場,卻成了這家公司的紅利收割場-情侶生活】的內容是由各互聯網用戶貢獻並自行上傳的,我們新聞網站並不擁有所有權的故也不會承擔相關法律責任。如您發現具有涉嫌版權及其它版權的內容,歡迎發送至:1@qq.com 進行相關的舉報,本站人員會在2~3個工作日內親自聯繫您,一經查實我們將立刻刪除相關的涉嫌侵權內容。