摘要:本發(fā)明為了彌補(bǔ)現(xiàn)有漢語(yǔ)分詞技術(shù)的不足,提出了一種實(shí)現(xiàn)智能聯(lián)想的行業(yè)詞語(yǔ)關(guān)聯(lián)度分詞方法。利用基于語(yǔ)義距離的概念相似度計(jì)算公式來(lái)獲得任一概念的相關(guān)概念,從而給出了屬于此行業(yè)領(lǐng)域的語(yǔ)義詞典完整的自動(dòng)構(gòu)建方法。建立分布式遞歸模型,將本地詞庫(kù)寫入云端詞庫(kù),檢索行業(yè)文章并存數(shù)據(jù)庫(kù),用云端詞庫(kù)過(guò)濾出屬于本行業(yè)的詞匯,根據(jù)隊(duì)列中消息讀取云端數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行去噪并分詞,取出出現(xiàn)次數(shù)最多的N個(gè)詞,或取出出現(xiàn)次數(shù)最多的一個(gè)詞,統(tǒng)計(jì)單據(jù)數(shù)量和詞語(yǔ)出現(xiàn)的次數(shù)。之后,計(jì)算詞語(yǔ)在每張單據(jù)中出現(xiàn)的平均次數(shù)。最后,計(jì)算詞語(yǔ)出現(xiàn)次數(shù)的標(biāo)準(zhǔn)差,從而實(shí)現(xiàn)快速、準(zhǔn)確聯(lián)想。
- 專利類型發(fā)明專利
- 申請(qǐng)人上海博科資訊股份有限公司;
- 發(fā)明人周小偉;商杰;
- 地址200333 上海市靜安區(qū)延安西路376弄22號(hào)5樓
- 申請(qǐng)?zhí)?/b>CN201310430100.3
- 申請(qǐng)時(shí)間2013年09月22日
- 申請(qǐng)公布號(hào)CN104462052A
- 申請(qǐng)公布時(shí)間2015年03月25日
- 分類號(hào)G06F17/27(2006.01)I;G06F17/30(2006.01)I;




教育裝備采購(gòu)網(wǎng)企業(yè)微信客服
京公網(wǎng)安備11010802043465號(hào)

