搜狗推出「唇語識別」技術:不出聲也能「聽」懂你
12 月 14 日,搜狗正式推出全新的人機交互新技術——唇語識別,這也是業內首個公開演示的唇語識別系統,通過機器視覺識別,不用聽聲音,僅靠識別說話人唇部動作,就能解讀說話者所說的內容。 與已有的語音識別產品不同,唇語識別是一項基于機器視覺與自然語言處理于一體的技術,因此在研發難度上比語音識別大得多。
搜狗語音交互中心技術總監陳偉表示,搜狗的唇語識別技術首創了復雜端到端深度神經網絡技術進行中文唇語序列建模,通過數千小時的真實唇語數據訓練,加上搜狗在自然語言處理方面的強大優勢,最終取得了業界領先的唇語識別效果。按照搜狗方面提供的數據顯示,在非特定人開放口語測試集上,搜狗唇語識別系統已經達到 60% 以上的準確率,超過 google 發布的英文唇語系統 50% 以上的準確率,在垂直場景如車載、智能家居等場景下甚至已經達到 90% 的準確率。



























粵公網安備 44030402000745號