摘要:進行音頻容噪斷句處理方法及系統(tǒng),包括:根據(jù)音頻獲取多個分幀段;根據(jù)各分幀段的能量值獲取能量閾值,根據(jù)所述能量閾值,從所述各分幀段中獲取其能量值超過能量閾值Et;的分幀段,則以該分幀段為句中間幀對該幀的前序幀或后序幀進行掃描,若前序幀或后序幀的能量閥值小于設(shè)定能量閾值Et,則將該幀與所述句中間幀按幀起始順序合并成為獨立句,之后對每個獨立句進行譜熵分析,獲取最后的分析句子。從而解決了現(xiàn)有字幕對應(yīng)過程中,無法進行自動斷句的問題。從而,本發(fā)明既可以處理已經(jīng)錄制好的音視頻,也可以處理正在直播的音視頻。對于網(wǎng)絡(luò)直播流,能夠自動的將網(wǎng)絡(luò)直播語音切割,方便后續(xù)環(huán)節(jié)如聽寫環(huán)節(jié)并行處理,加快處理時間。
- 專利類型發(fā)明專利
- 申請人北京華科飛揚科技股份公司;
- 發(fā)明人胡飛;
- 地址100000 北京市朝陽區(qū)小營路13號1號樓5006室
- 申請?zhí)?/b>CN201610799384.7
- 申請時間2016年08月31日
- 申請公布號CN106373592A
- 申請公布時間2017年02月01日
- 分類號G10L25/48(2013.01)I;H04N5/278(2006.01)I;




教育裝備采購網(wǎng)企業(yè)微信客服
京公網(wǎng)安備11010802043465號

