很多朋友估計(jì)沒(méi)有做過(guò)這一塊,爭(zhēng)取最簡(jiǎn)潔的語(yǔ)言描述清楚。
一、業(yè)務(wù)簡(jiǎn)述

從業(yè)務(wù)上看整個(gè)智能廣告系統(tǒng),主要分為:
1)
業(yè)務(wù)端:廣告主的廣告后臺(tái)
2)
展現(xiàn)端:用戶(hù)實(shí)際訪問(wèn)的頁(yè)面
業(yè)務(wù)端,
廣告主主要有兩類(lèi)行為:
1)
廣告設(shè)置行為:例如設(shè)置投放計(jì)劃,設(shè)置地域,類(lèi)別,關(guān)鍵字,競(jìng)價(jià)等
2)
效果查看行為:例如廣告展示次數(shù)是多少,廣告點(diǎn)擊次數(shù)是多少等
展現(xiàn)端,
用戶(hù)主要也有兩類(lèi)行為:
1)
站點(diǎn)瀏覽行為:用戶(hù)瀏覽實(shí)際的信息,此時(shí)廣告系統(tǒng)決定出廣告主的什么廣告
2)
廣告點(diǎn)擊行為:此時(shí)廣告系統(tǒng)會(huì)對(duì)廣告主進(jìn)行扣費(fèi)
二、業(yè)務(wù)流程
下面通過(guò)一個(gè)的例子,讓業(yè)務(wù)流程更直觀。
步驟一:廣告主在業(yè)務(wù)端投遞廣告廣告主登錄業(yè)務(wù)端后臺(tái),進(jìn)行設(shè)置:
?今日投放
地域是“北京-上地”
?投放
類(lèi)別是“租房”
?定向
人群為“女”,“30歲以下”
?需要推廣的廣告
內(nèi)容是他發(fā)布的一條“房屋出租”的帖子
?
競(jìng)價(jià)設(shè)置的是0.2元
?單日
預(yù)算是20元
這些數(shù)據(jù),當(dāng)然通過(guò)業(yè)務(wù)端存儲(chǔ)到了數(shù)據(jù)層,即數(shù)據(jù)庫(kù)和緩存里。
步驟二:用戶(hù)來(lái)到了網(wǎng)站,進(jìn)入了“北京-上地-租房”類(lèi)別,廣告初篩實(shí)施用戶(hù)產(chǎn)生了平臺(tái)瀏覽行為,網(wǎng)站除了展示自然內(nèi)容,還要展示廣告內(nèi)容。被展現(xiàn)的廣告不能太離譜,太離譜用戶(hù)也不會(huì)點(diǎn)擊。

合適的廣告,必須符合“
語(yǔ)義相關(guān)性”,即
基礎(chǔ)檢索屬性(廣告屬性)必須符合(
廣告能否滿(mǎn)足用戶(hù)的需求,滿(mǎn)足了點(diǎn)擊率才高),這個(gè)工作是通過(guò)
BS-basic search檢索服務(wù)完成的。
BS從數(shù)據(jù)層檢索到“北京-上地-租房”的廣告帖子。
步驟三:用戶(hù)屬性與廣告主屬性匹配,廣告精篩實(shí)施步驟二中,基礎(chǔ)屬性初篩了以后,要進(jìn)行
更深層次的策略篩選(
用戶(hù)能否滿(mǎn)足廣告的需求),此例中,廣告主的精準(zhǔn)需求為:
?用戶(hù)
性別為“女”
?用戶(hù)
年齡為“30歲以下”
?用戶(hù)
訪問(wèn)IP是“北京”

系統(tǒng)將初篩出來(lái)的M條廣告和
用戶(hù)屬性進(jìn)行匹配篩選,又過(guò)濾掉了一部分,最后剩余N條待定廣告,這些廣告既滿(mǎn)足用戶(hù)的需求(初篩),這些用戶(hù)也滿(mǎn)足廣告主的需求(精篩),后者是在
AS-advanced search策略服務(wù)完成的。
步驟四:綜合排序,并返回Top X的廣告經(jīng)過(guò)步驟2和步驟3的初篩和精篩之后,待選的N條廣告既能滿(mǎn)足用戶(hù)當(dāng)前的需求,用戶(hù)亦能滿(mǎn)足廣告主的篩選需求,但實(shí)際情況是,廣告位只有3個(gè),怎么辦呢?就需要我們對(duì)N條廣告進(jìn)行綜合打分排序(
滿(mǎn)足平臺(tái)的需求,廣告平臺(tái)要多賺錢(qián)嘛)。
打分排序的依據(jù)是什么呢?有人說(shuō)按照
競(jìng)價(jià)排序bid,出價(jià)高的打分高(這是大家對(duì)百度最大的誤解,百度是cpc收費(fèi))
有人說(shuō)按照
CTR點(diǎn)擊率排序,CTR高的點(diǎn)的人多(百度的kpi指標(biāo)可不是pv)
出價(jià)高,但沒(méi)人點(diǎn)擊,廣告平臺(tái)沒(méi)有收益;點(diǎn)擊率高,但出價(jià)低,廣告平臺(tái)還是沒(méi)有收益。
最終應(yīng)該按照廣告的出價(jià)與CTR的乘積作為綜合打分排序的依據(jù),bid*CTR。
既然bid*CTR是所有廣告綜合打分的依據(jù),且
出價(jià)bid又是廣告主事先設(shè)定好的,那么實(shí)際上,廣告排序問(wèn)題的核心又轉(zhuǎn)向了廣告CTR的預(yù)測(cè),
CTR預(yù)測(cè)是推薦系統(tǒng)、廣告系統(tǒng)、搜索系統(tǒng)里非常重要的一部分,是一個(gè)工程,算法,業(yè)務(wù)三方結(jié)合的問(wèn)題,本文就不展開(kāi)討論了。
無(wú)論如何,N條廣告,根據(jù)bid*預(yù)估CTR進(jìn)行綜合打分排序后,返回了打分最高的3個(gè)廣告(廣告位只有3個(gè))。
有些系統(tǒng)沒(méi)有第二步驟用戶(hù)屬性過(guò)濾,而是將用戶(hù)屬性因素考慮到綜合排序中。
步驟五:展現(xiàn)端展示了廣告,用戶(hù)點(diǎn)擊了廣告展示了廣告后,展現(xiàn)端js會(huì)上報(bào)廣告
展示日志,有部分用戶(hù)點(diǎn)擊了廣告,服務(wù)端會(huì)記錄
點(diǎn)擊日志,這些日志可以作為廣告算法實(shí)施的數(shù)據(jù)源,同時(shí),他們經(jīng)過(guò)統(tǒng)計(jì)分析之后,會(huì)被展示給廣告主,讓他們能夠看到自己廣告的展示信息,點(diǎn)擊信息。
這些日志(一般會(huì)實(shí)施AB測(cè)),也是算法效果好壞評(píng)估的重要依據(jù),根據(jù)效果逐步優(yōu)化改進(jìn)算法。
步驟六:對(duì)廣告主進(jìn)行扣費(fèi)用戶(hù)既然點(diǎn)擊了廣告,平臺(tái)就要對(duì)投放廣告的廣告主進(jìn)行
扣費(fèi)了,扣費(fèi)前當(dāng)然要經(jīng)過(guò)反作弊系統(tǒng)的過(guò)濾(主要是惡意點(diǎn)擊),扣費(fèi)后信息會(huì)實(shí)時(shí)反映到數(shù)據(jù)層,費(fèi)用扣光后,廣告就要從數(shù)據(jù)層下線。
三、系統(tǒng)綜述

聊完業(yè)務(wù)流程,再來(lái)看系統(tǒng)架構(gòu),任何脫離業(yè)務(wù)的架構(gòu)設(shè)計(jì)都是耍流氓。
從系統(tǒng)分層架構(gòu)上看,智能廣告系統(tǒng)分為三層:
?
站點(diǎn)層:用戶(hù)和廣告主直接面向的網(wǎng)站站點(diǎn)
?
服務(wù)層:為了實(shí)現(xiàn)智能廣告的業(yè)務(wù)邏輯,提供的通用服務(wù),此處又主要分為
四大類(lèi)服務(wù):
策略服務(wù)BS:實(shí)施廣告策略,綜合排序
檢索服務(wù)AS:語(yǔ)義相關(guān)性檢索
計(jì)費(fèi)服務(wù):用戶(hù)點(diǎn)擊廣告時(shí)進(jìn)行扣費(fèi)
反作弊服務(wù):不是每次點(diǎn)擊都扣費(fèi),要經(jīng)過(guò)反作弊,去除惡意點(diǎn)擊(相對(duì)獨(dú)立,未在架構(gòu)圖中畫(huà)出)
?
數(shù)據(jù)層:用戶(hù)數(shù)據(jù),廣告數(shù)據(jù),競(jìng)價(jià)數(shù)據(jù),日志數(shù)據(jù)等等等等
四、總結(jié)
智能廣告系統(tǒng)的業(yè)務(wù)流程與系統(tǒng)架構(gòu):
1)
廣告主投放與設(shè)置廣告2)
用戶(hù)訪問(wèn)平臺(tái),展現(xiàn)合適廣告 通過(guò)
廣告屬性,進(jìn)行
“語(yǔ)義相關(guān)性”初篩,通過(guò)BS完成
通過(guò)
用戶(hù)屬性,出價(jià)信息,點(diǎn)擊率預(yù)測(cè)信息,進(jìn)行
綜合打分排序篩選,通過(guò)AS完成
3)
記錄展現(xiàn)日志,點(diǎn)擊日志,進(jìn)行扣費(fèi)廣告是展現(xiàn),是一個(gè):
?廣告滿(mǎn)足用戶(hù)需求(初篩)
?用戶(hù)滿(mǎn)足廣告需求(精篩)
?平臺(tái)利益最大化(bid*CTR綜合排序)
的過(guò)程
廣告的排序不是由出價(jià)(bid)決定的,而是
由出價(jià)(bid)*點(diǎn)擊率(ctr)決定的。
點(diǎn)擊率(ctr)是一個(gè)未來(lái)將要發(fā)生的行為,智能廣告系統(tǒng)的核心與難點(diǎn)是點(diǎn)擊率預(yù)測(cè)。
更多建議: