信息摘要:
事件營銷之百度事件脈絡的算法詳解:百度事件脈絡在關鍵詞上的展示會隨著事件的轉發(fā)量而增加,當然,如果事件的熱度下降了,展現的廣度也會隨著縮小。新聞事件距離,新聞集合去噪,時間片類聚,代表新聞選取,可以輕輕松松的了解到整個事件發(fā)展的全過程,有效的提高獲取
如果你在百度之中輸入“黃海波”、“巴西世界杯”等熱門詞匯時會發(fā)現,右側首次出現一條時間軸信息圖,這就是事件脈絡。這是百度新推出的一種搜索效果,它是按照時間的順序將整個事件的發(fā)展過程,按照時間軸的組織方式呈獻給用戶,讓用戶迅速的掌握一個事件的來龍去脈。
百度事件脈絡在關鍵詞上的展示會隨著事件的轉發(fā)量而增加,當然,如果事件的熱度下降了,展現的廣度也會隨著縮小。下面,讓我們朗創(chuàng)網絡營銷一起來了解一下百度事件脈絡的算法:
新聞事件距離:在新聞發(fā)布高峰期間隔1小時,要比在新聞發(fā)布的低谷期間隔一小時,造成的時間跨度更長。一般上午是新聞發(fā)布的高峰,下午兩點到四點也是。對不同時間段的新聞發(fā)布數量進行統計,可以幫助到后續(xù)的時間片聚類。
新聞集合去噪:不同媒體對事件的報到的時效性是不一樣的,進行時間片聚類之前,還應該去除掉相似的新聞,為了避免同一類新聞太過相似,比較特征向量,利用該特征向量,如果新聞集合太大,就應該利用站點的權威性進行過濾。
時間片類聚:每一篇新聞,抽取發(fā)布時間;根據發(fā)布時間,把一個新聞事件集合內的新聞進行排列。將新聞按照發(fā)布時間投放到時間軸上,如果事件的發(fā)展比較明顯,就能在時間軸上看到一些新聞比較密集的區(qū)域,這個區(qū)域就是我們想要獲得的新聞發(fā)展的個個階段。
代表新聞選?。?/strong>新聞來源的站點的權威性如何,該新聞是否在第一時間進行發(fā)布,新聞的轉載量如何等等。
通過對具體例子進行分析我們也可以發(fā)現事件脈絡中展現的額信息發(fā)布日期,即時間脈絡中的日期,誤差多不會超過一天;發(fā)布時間一般會集中在早上8點~11點,以及下午13~16點且轉發(fā)量較大,基本在500以上。
事件脈絡是以時間為主線的方式來進行呈現的,這樣用戶就不用再自我梳理,可以輕輕松松的了解到整個事件發(fā)展的全過程,有效的提高獲取信息的效率,并且對用戶進行深入引導。
搜索引擎的目的在于滿足人們的需求,能夠更好地對搜索結果進行匹配與分類,與用戶之間形成完美的互動,這就是搜索引擎發(fā)展的大趨勢。