|
今天,我們來談?wù)勈裁词?/font>“人群”。淘寶會給做得好的KA商家分析八大人群占比,八大人群我就不詳細(xì)列舉了。很多商家覺得這個很有用,想優(yōu)化一下?即使這八大人群有用,你如何針對優(yōu)化?針對每個人群付費推廣?還是結(jié)合達(dá)摩盤和數(shù)據(jù)銀行去做營銷數(shù)據(jù)包?“向量”是如何影響搜索? 淘寶的八大人群無非就是一個分類類別,就如同消費者可以分為男、女、消費能力、職業(yè)、地域一樣只是系統(tǒng)給打上的類別符號,它最多說明了你所在類目品類下以往歷史成交人群的人群特征。 品類就是最大的市場,這個需求市場的人群特征是這樣的,但是不代表你店鋪的人群就是這樣的。 什么是人群?是一段時間內(nèi)對某類東西有需求,而在關(guān)注和搜索也就是有購買意向的人。八大人群是這個類目的人群特征如果沒有需求驅(qū)動他對于你來說就什么都不是,如果去談優(yōu)化而不是針對這些人群特征做針對性優(yōu)化,源頭還是要從“購物意圖”開始。 正文 一:沒有購物意圖統(tǒng)一的人群就是一幫散人,散人的特征就算符合你的目標(biāo)客戶群體,但是在特定時間內(nèi)沒有匹配你產(chǎn)品需求就是獨立的人和你沒有半毛錢關(guān)系,就算是在這個推薦式搜索的時代,歷史行為軌跡數(shù)據(jù)也只能服務(wù)于第一次搜索,召回的是有相同購物意圖的人而不是具有相同的人群特征。 簡單來說需求統(tǒng)一的人才叫人群,標(biāo)簽就是一個過去式根據(jù)以往歷史行為軌跡特征給貼上的類別符合。 一談人群或者人群標(biāo)簽很多同學(xué)就懵了,原因就在于沒有理解“針對你的品類一段時間內(nèi)具有相同購物意圖的人”才稱得上你的人群,首先是購物意圖統(tǒng)一,也就是需求統(tǒng)一;后面再通過人群結(jié)構(gòu)(性別、年齡、消費層次、職業(yè)等)過濾來提高原有相同購物意圖人群的點擊率和轉(zhuǎn)化率,如果你需求統(tǒng)一后人群結(jié)構(gòu)沒有幫助你提高點擊率或者轉(zhuǎn)化率就不要去開這些基礎(chǔ)屬性人群。 有多少同學(xué)把基礎(chǔ)屬性人群標(biāo)簽當(dāng)人群的? 不開基礎(chǔ)屬性人群就感覺沒有開人群,沒有開標(biāo)簽? 試問一下各位同學(xué):如果沒有相同的購物意圖做到需求統(tǒng)一,你測試這些有任何的意義嗎?更有很多同學(xué)上來把關(guān)鍵詞加滿去測試,需求本身就不統(tǒng)一,實時造成需求流動自然測試的基礎(chǔ)屬性組合人群今天好明天差的情況。 需求統(tǒng)一,一定要站在市場需求的角度來看待匹配不能站在關(guān)鍵詞的角度,大部分同學(xué)選擇關(guān)鍵詞就喜歡根據(jù)搜索人氣和在線商品數(shù)來分析競爭格局,這個思維本身就進(jìn)入了高競爭市場,只有站在市場需求的角度來安排關(guān)鍵詞,通過關(guān)鍵詞背后的購物意圖來滿足一個市場需求,通過“一品類一市場,一屬性一人群”用市場需求細(xì)分去進(jìn)行錯位競爭,而不能按照老的關(guān)鍵詞競爭環(huán)境思維去布局關(guān)鍵詞。 這個問題同樣是向量問題: 很多同學(xué)問我什么是向量,向量的概念:既有大小又有方向上的量,最后你會發(fā)現(xiàn)向量就是語義向量。 我用算法思維給大家解釋這個問題 淘寶是臺機(jī)器是個系統(tǒng),在計算機(jī)語言類任何詞語都是萬個零中的一個一,在計算機(jī)語言系統(tǒng)里詞就是實數(shù)來表述的,現(xiàn)在是推薦搜索算法排序機(jī)制,談到推薦搜索就必須談?wù)倩貦C(jī)制。 召回機(jī)制:詞召回和向量召回詞召回用算法思維來解釋既然每個詞都是一個實數(shù),那么系統(tǒng)只需召回實數(shù)相似的商品回來形成商品集合。 基本思路是:如果這個兩個標(biāo)題用詞越相似,它的內(nèi)容就應(yīng)該越相似,因此可以從詞頻入手,計算他們的相似程度進(jìn)行召回。 咱們上新一個新品加上看商品質(zhì)量分和上架時間因素還真按照這個思路召回的這個階段就是召回階段也叫粗排。 這種詞(實數(shù)通過TF-IDF值獲得)召回有個最大的缺點就是沒有表達(dá)詞語間語意,所以必須要解決語義相似度的問題這時候就有了語義向量、向量召回。 談向量召回就不得不提兩個算法: TF-IDF算法: TF-IDF是一種統(tǒng)計方法,用以評估一字詞對于一個文件集或一個語料庫中的其中一份文件的重要程度。 IF值:是指 term 在標(biāo)題中出現(xiàn)的頻率。某個詞在標(biāo)題中出現(xiàn)了多少次。 IDF值:由 詞(term) 出現(xiàn)在語料庫的數(shù)目總數(shù)來決定。 TF-IDF=TF*IDF TF-IDF與一個詞在文檔中的出現(xiàn)次數(shù)成正比,與該詞在整個語言中的出現(xiàn)次數(shù)成反比。搜索時,對于每個文檔,都可以分別計算一組搜索詞("termA"、"termB"、"termC")的TF-IDF,將它們相加,就可以得到整個文檔的TF-IDF。 這個值最高的文檔就是與搜索詞最相關(guān)的文檔。 從算法的角度給大家解釋什么是TF-IDF值以及它的作用其實就是幫助我們提取權(quán)重比較高的關(guān)鍵詞。 上述也有說缺點就是,單純以"詞頻"衡量一個詞的重要性,不夠全面,有時重要的詞可能出現(xiàn)次數(shù)并不多。而且,這種算法無法體現(xiàn)詞的位置信息,出現(xiàn)位置靠前的詞與出現(xiàn)位置靠后的詞,都被視為重要性相同,這是不正確的。 如何解決這個問題? 就要談另一個word2vec算法: 將詞表征為實數(shù)值向量的高效工具,利用深度學(xué)習(xí)思想,通過訓(xùn)練,把對文本內(nèi)容的處理簡化為 K 維向量空間中的向量運算,而向量空間上的相似度可以用來表示文本語義上的相似度。 這樣就可以用TF-IDF結(jié)合余弦相似性,解決這個問題。 通俗一點,相似性可以用距離來衡量。 而在數(shù)學(xué)上,可使用余弦來計算兩個向量的距離。 這就是向量空間模型:是一種將文檔轉(zhuǎn)化成向量的方式,文檔轉(zhuǎn)化成了向量,從而可以在同一維度的空間中表示一個個的文檔。 向量中的每個元素是一個個的實數(shù),每個元素對應(yīng)著一個 詞(term),實數(shù) 是通過tf-idf計算出來的。 tf-idf也僅僅是一種將詞(term)轉(zhuǎn)化成實數(shù)的方式,當(dāng)然我們也可以通過其他方法將 詞 轉(zhuǎn)化成實數(shù),方式有很多種。 現(xiàn)在能明白向量是什么東西了吧,向量解決的是語義相似度問題。 向量召回也就是相同購物意圖語義的召回 你去人為操作解決的永遠(yuǎn)是TF-IDF值問題,而永遠(yuǎn)解決不了語義向量問題,干預(yù)越多反而越影響向量的問題,系統(tǒng)都不知道你是什么東西表明什么語義,怎么給你推薦。 這也是我們18年就放棄講坑產(chǎn),改為標(biāo)簽的根本原因,歷史行為軌跡形成的標(biāo)簽也可以轉(zhuǎn)化成實數(shù)進(jìn)行向量召回。 所以假的永遠(yuǎn)是假的,人為干預(yù)就是自嗨罷了。 [注]詞向量的計算結(jié)果:最終的詞向量里面,相似的單詞,他們的詞向量值在比例上也是相似的。 詞向量的相似性衡量:事實上我們通常會用余弦距離去衡量詞向量的相似性,即詞向量間的夾角。
如果你懂一點余弦定理的話兩個向量相減不是此消彼長而是會改變向量方向。這也是為什么有些鏈接斷崖式下跌的根本原因之一。 二:市場需求是一個變量還是恒量。 這是我前幾天在一個集團(tuán)做內(nèi)訓(xùn)引起我思考的一個問題。 有個同學(xué)說店鋪品類規(guī)劃很亂、客單價很亂如何定位?在人群的方面上大家討論了很久,有一個比較大的分歧就是一個品類的高客單價人群在其他品類下是什么人群的問題? 其實我的觀點很明確:只用價格帶定人群不要考慮品類。 同價格帶就聚焦人群,在我看來任何市場需求不管站在人口基數(shù)還是任何分層人群,“需求”都是一個相對恒量的。 一個店鋪定高客單還是低客單要看店鋪實際成交的客單價,而不能看單品。 作為一個消費者也不會分在品類下是高客單,在另一個品類下是低客單,只考慮消費者消費能力。 其實在大家還存在一個誤區(qū):就是自定義基礎(chǔ)屬性人群,類目筆單價并不是客單價,月消費也不是說在這個類目每月花多少錢。 類目筆單價對應(yīng)的只是180天內(nèi)在這個類目有消費過,月消費只能看出來他是不是淘寶平臺忠實客戶,在平臺消費情況,其實和你們自有店鋪沒有任何直接關(guān)系。 這些基礎(chǔ)屬性人群標(biāo)簽就是在幫你過濾出來具有相同購物意圖的人群的人群特征而已,這個畫像成為種子人群標(biāo)簽畫像。 特別是一個店鋪價格帶跨度大的,舉例:假設(shè)便宜的99,中客單的599,高的1999;如果實際成交客單價就圍繞99-199之間他其實就是低客單人群,如果真實客單價是599-999就是中端人群;999-1999高端人群,再添加品類定價就要圍繞著店鋪真實平均客單價來定。如果你做的是同品類葉子類目產(chǎn)品建議就圍繞一個價格段,千萬別中高端人群全吃,根本不可能,先不從推薦算法談,就從市場需求恒定原理,你用99的低客單滿足了市場大部分需求,市場份額及需求就那么大,你的新品你的高客單產(chǎn)品怎么賣? 最后肯定新品按庫存最低價傾銷了,這樣的多價格帶布局很容易造成這樣的“囧局”。 只有市場需求細(xì)分市場才有定價權(quán),你做什么樣的生意就要先分析市場競爭格局。 突破的絕對不會是價格,只有細(xì)分市場或者根據(jù)消費者的需求進(jìn)行改造升級的產(chǎn)品才會打破價格困局。 產(chǎn)品為王必須滿足于市場需求為前提,產(chǎn)品不是數(shù)據(jù)自嗨,要看消費者的真實接受程度,那些點擊率高,收藏加購率高的產(chǎn)品多的事不成交就說明不滿足:“市場需求”,解決轉(zhuǎn)化問題必須從市場需求為導(dǎo)向而不能去找更多關(guān)鍵詞機(jī)會。 市場需求的背后才是關(guān)鍵詞。 任何市場需求都是一個恒量,機(jī)會在于細(xì)分市場和人群分層,多維度多角度去布局,前期一定是錯位切入做差異化垂直類細(xì)分市場,先滿足一部分人需求,再去解決另一部分需求,做搜索就是階梯式的一個個解決不同需求的過程,流量也是階梯式一步步遞增的過程。 市場需求是個相對恒量,價格帶區(qū)分人群決定了競爭環(huán)境。
|