亚洲视频二区_亚洲欧洲日本天天堂在线观看_日韩一区二区在线观看_中文字幕不卡一区

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.430618.com 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

 

從0到1,基于內容的推薦算法的產品設計

 

一、前言&定義

可能很多和筆者一樣非數據或算法科班出身的產品同學在涉及到需要進行內容推薦的產品時無從下手,盡管在網絡上可搜索到各種算法的基本原理和公式,但或過于專業或直接呈現最終邏輯,但具體怎么做還是一頭霧水,筆者拋開理論和復雜的公式,直接從產品出發設計一套最小可行性從0到1的推薦算法能力

 

什么是基于內容的推薦算法

基于內容的推薦:核心思想是根據推薦物品或內容的元數據,發現物品或者內容的相關性,然后基于用戶以往的喜好記錄,推薦給用戶相似的物品。

從0到1,基于內容的推薦算法的產品設計

簡單地理解就是:根據用戶過去喜歡的內容,為用戶推薦和他過去喜歡的內容相似的內容。

 

二、算法整體架構說明

1. 明確算法目的

我們在最開始做推薦算法時,要清楚初始階段目的:即在保證內容質量的前提下根據用戶行為推薦盡可能符合用戶期望的豐富內容。

這句話雖然很短,但包含了三個很重要的關鍵詞:內容的質量、內容豐富(多元)度和符合預期。

 

2. 推薦算法整體邏輯

基于推算的場景,我們很容易發現推薦邏輯:用戶在線進行操作行為時,系統向后臺發起用戶數據召回請求,然后根據排序模型形成最終用戶看見的內容,最后通過用戶的請求和記錄完善用戶行為,以進行后續的內容匹配。常見的推算下圖:

從0到1,基于內容的推薦算法的產品設計

圖片雖然看起有點復雜,抽絲剝繭就三個核心:一套內容管理后臺+多個權重算法+展示邏輯。

 

3. 推薦算法產品框架

基于算法邏輯和最小可行性目的,我們可以整理出簡單的產品框架,如下圖:

從0到1,基于內容的推薦算法的產品設計

很明顯算法推薦公式可以不用立馬就建立一套復雜的算法模型,只要有基礎的用戶管理、內容管理能力,結合內容質量權重和用戶喜好權重,考慮到去中心化和時效應影響,就可完成在保證內容質量的前提下根據用戶行為推薦盡可能符合用戶期望的豐富內容。

 

三、具體算法權重設計

1. 質量管理評分公式

質量評分總得分Score由三大模塊得分加權計算得出,其公式如下所示:

(系數可根據業務情況自行調整,起始分為100)

其中A、B、C為三大模塊各自得分值。Score得分為三大模塊得分乘以各自對應系數。

各模塊得分由其多項評分指標及對應系數加權計算得到,此處以A模塊為例:

其中為A模塊下對應的各項指標得分, 為各項指標得分所對應的權重系數。

A-內容流量模塊評分

內容流量為是內容對流量的吸引能力體現,初始化的產品建議的核心熱度加權:停留時間(退出率)>評論量>點贊量>收藏量>PV/UV>轉發量。下表為案例:

從0到1,基于內容的推薦算法的產品設計

B-內容質量模塊評分

主要根據后臺內容的狀態進行評斷,在機審能力未完全搭建以前,本模塊受到人工影響較大。

從0到1,基于內容的推薦算法的產品設計

附:評分公式

目前對于內容推薦型的評分算法,推薦貝葉斯平均評分法作。其公式如下:

其中,n為當前內容的評分次數,M為總內容平均得分,S為單個內容總得分,C為動態系數。

單個內容評分得分 = (總內容的平均得分 * C系數) + 單個產品的評分總和) / (當前內容的評分次數+ C系數)

C系數為每個內容的被評分的平均次數,即C=所有內容被評論的總次數/所有內容數量。例如:總共有1000個文章 一共被評論了50000次,那C就等于50000/1000=50。

小例:

從0到1,基于內容的推薦算法的產品設計

(貝葉斯平均法評估示例)

結論:以貝葉斯平均為依據的排序更能反應真實的情況,打分次數多且評分較高的產品會更加靠前,打分次數多評分較低的產品則會更加靠后,與單純依據每個產品的平均分排序相比,這種結果更有意義。

C-用戶質量模塊評分

用戶質量根據后臺人工標識用戶屬性加上其發帖質量2個維度構成。

從0到1,基于內容的推薦算法的產品設計

 

2. 用戶喜好評分公式

用戶行為記錄是獲取用戶相關推薦的主要依據,初期是根據用戶關注、瀏覽喜好以及用戶搜索關鍵詞對用戶喜好進行統計,基本的邏輯如下:

從0到1,基于內容的推薦算法的產品設計

喜好評分=瀏覽喜好分類*0.6+關注人內容*0.4 +搜素內容分類*0.0

(系數可根據業務情況自行調整,起始分為100)

從0到1,基于內容的推薦算法的產品設計

舉例說明:

(1)通過用戶的瀏覽記錄,獲得用戶的喜好標簽

從0到1,基于內容的推薦算法的產品設計

那么對于同一分類下的內容按照公式增加喜好值。

(2)獲取用戶的關注用戶,獲得喜好標簽

從0到1,基于內容的推薦算法的產品設計

那么對于關注用戶下的內容按照公式增加喜好值。

(3)如果內容1屬于分類A,并且是用戶D創建的,這個內容對于用戶來說就是兩個權重值相加 =查看內容分類*0.6+關注人內容*0.4

 

四、前端展示權重設計

通過質量評分和用戶喜好評分,我們能得到以內容為主。針對不同用戶的內容質量和喜好評分值,那么就可以得到一個簡單的推薦邏輯(推薦列表):按照用戶喜好評分推薦質量評分較高的內容,若得分相同則按內容創建時間倒序排列進行推薦。

但在實際推薦中除了保證用戶喜好外,需要嘗試去中心化的內容展示模式,所以最終展示的推薦內容,應該來自三個模塊:

A、用戶喜好列表:通過用戶喜好評分,為用戶推薦內容評分質量較高的內容,這是主要推薦內容。

推薦邏輯:先對內容按照用戶喜好值進行從高到低的排序,再喜好值A以上的內容中依次健康值高于閥值B、閥值C、閥值D的內容隨機推薦,低于閥值D不進行推薦。

B、高質量非喜好列表:用戶喜好值低于某個閥值但內容流量評分較高的內容。

C、初始流量推薦列表:通過用戶喜好評分,為用戶推薦內容質量審核過但流量不高的內容。

從0到1,基于內容的推薦算法的產品設計

老用戶算法為:Score=A*0.7+B*0.2 +C*0.1(系數可根據業務情況自行調整)

其中0.7、0.2、0.1位A、B、C為三大模塊初始系數,它受到時間效應變化。

新用戶冷啟動的算法為:ScoreL= B*0.9 +C*0.1

其中B模塊直接調用流量池健康評分。

注意:喜好評分和健康值相同時,隨機選取加載量,在同一輪加載過程中同一信息需要剔重。

 

1. 時間效應計算方式

為了進一步去中心化,以及推薦準確性,根據熱度冷卻公式:

本期系數 = 上期系數 x exp(-(冷卻系數) x 間隔的小時數)。T為初始熱度,此處默認為0.7,為上一期溫度,為冷卻系數,為間隔小時數。

 

五、關于A/B測試

推算推薦更加需要進行A/B test,因為我們在初始化的過程中,具體的權重設置是否合理是無法得知的,但是能保證的時沒有垃圾推薦的流出,所以A/B測試結果對優化權重格外重要,將用戶分流至對應方案內,在保證每組用戶特征相同的前提下,根據用戶的真實數據反饋,幫助產品決策。當然隨著測試樣本變多對技術架構考驗越大。

 

六、尾聲

正如開頭所說本文的算法是剝離于內容推薦算法理論公式,根據實際產品出發進行的設計,其核心是保證內容質量的前提下根據用戶行為推薦盡可能符合用戶期望的豐富內容,具有相當的局限性,它適用于沒有完善的算法團隊和進行最小可行試驗的產品。希望文章對和我一樣沒有算法基礎的同學帶來幫助和啟發,野路子的產品悲哀。歡迎大家交流。

本文由 @jingtianz 原創發布于人人都是產品經理。未經許可,禁止轉載

題圖來自Unsplash,基于CC0協議

分享到:
標簽:產品設計
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定