新聞動态
用戶輸入關鍵詞進行檢索,百度搜索引擎在排序環節要做兩方面的事情: 第把相關的網頁從索引庫中(zhōng)提取出來;第二,把提取出來的網頁按照不同維度的得分(fēn)進行綜合排序。
“不同維度” 包括:
(1) 相關性。網頁内容與用戶檢索需求的匹配程度,如網頁包含的用戶檢查關鍵詞的個數,以及這些關鍵詞出現的位置;外(wài)部網頁指向該頁面所用的錨文本等。
(2) 權威性。用戶喜歡有一(yī)定權威性網站提供的内容,相應地,百度搜索引擎也更相信優質權威站點提供的内容。
(3) 時效性。時效性結果指的是新出現的網頁,且網頁内承載了新鮮的内容。目前,時效性結果在搜索引擎中(zhōng)日趨重要
(4) 重要性。網頁内容與用戶檢查需求匹配的重要程度或受歡迎程度。
(5) 豐富度。豐富度看似簡單,卻是一(yī)個覆蓋範圍非常廣的命題,可以理解爲網頁内容豐富,可以完全滿足用戶需求;也可以理解爲不僅可以滿足用戶單一(yī)需求,還可以滿足用戶的延展需求。
(6) 受歡迎程度,指該網頁是不是受歡迎
以上便是百度搜索引擎決定搜索結果排序時考慮的六大(dà)原則。那麽,六大(dà)原則的側重點是怎樣的呢? 哪個原則在實際應用時占比最大(dà)呢? 其實,在這裏沒有一(yī)個确切的答案。在百度搜索引擎早期,這些阈值的确是相對固定的,如“相關性" 在整體(tǐ)排序中(zhōng)的重量可以占到七成,但随着互聯網的不斷發展,檢索技術的進步,網站建設數量的爆發式增長,相關性已經不是難題。于是,百度搜索引擎引人了機器學習機制,讓程序自動産出計算公式,推進排序策略更加合理。