微博智能排序的一些思考 |
發(fā)布時間: 2012/8/6 11:20:54 |
最近,新浪微博信息流默認排序方式從一開始的“按時間排序”更改為“智能排序”,其實智能排序這個功能早在6月18號就推出來了,只不過當時沒有強制推送,并且入口不明顯,沒有引起大家重視,在最近新浪強制推送之后,引起了很多用戶的反感,各種猜測和吐槽也隨之而來,有人覺得這是強奸了用戶,有人覺得這是要商業(yè)化的前奏,甚至把這個問題類比于百度搜索的競價排名。
極客公園不參與吐槽,也不會去爭執(zhí),僅就現(xiàn)象的問題去挖掘一些本質(zhì),供讀者參考。 微博的信息梳理 微博的短板處理——信息過載 微博的智能排序,按照官方的說法是可以根據(jù)關(guān)注、標簽和微博內(nèi)容等相關(guān)信息,幫助用戶梳理微博內(nèi)容,對同類微博進行合并、對可能感興趣的微博內(nèi)容進行優(yōu)先展示的排序功能。 先拋開大家所懷疑的商業(yè)目的或者內(nèi)容的審查和其它,這至少說明一個問題,微博自己也已經(jīng)意識到了自己的內(nèi)容的重復性造成的信息過載,這是所有UGC網(wǎng)站的共同問題,解決時間線無效信息過多造成的信息過載。 知乎上的知友提出了 Facebook 的參考樣本: 信息過載之后,選擇“數(shù)據(jù)算法”來“優(yōu)化”信息質(zhì)量,是web上常見的一種方式。Facebook著名的News Feeds開創(chuàng)了NFO( News Feeds Optimization),也一直飽受非議。這背后的關(guān)鍵問題是:到底什么樣的信息才是重要的?根據(jù)關(guān)系?根據(jù)算法?根據(jù)我的點擊? 通過算法來計算信息的重要性,是人類典型的無知:我們知道的越多,我們越無知。信息的重要性完全是人的直覺的感受,非常動態(tài),無法計算。這或許也是人類其實值得驕傲的地方。 智能排序表面上會打亂信息排序,但是我不覺得用戶會對此有明確的感知,畢竟信息太多,并且還是互相斷裂的,時間的秩序感并不是那么重要。 我不覺得新浪微博的智能排序有什么陰謀,這其實是業(yè)界常規(guī)的一種處理方式。 在功能上,微博在智能排序上做了改進,只是由于新浪的強推,才會讓用戶覺得反感,微博在新功能的推送和引導方面,還有很大的改進空間。 時間線和信息流的整理的規(guī)則制定 對用戶 Timeline 的梳理,把對用戶更有價值的內(nèi)容優(yōu)先展示,這個是對抗垃圾內(nèi)容獲取微博信息價值的一種好辦法,從出發(fā)點和優(yōu)化微博的媒體屬性來說不見得是一件壞事,其實最大的爭議就是該由誰來制定整理和排序的規(guī)則。 假如把微博比喻為郵箱,當做你所有信息的收件箱,那么郵箱有一種情況,就是用戶通過設(shè)置不同的關(guān)鍵詞和規(guī)則將不同的郵件進行了分類整理,方便查找和處理郵件的內(nèi)容,這屬于用戶自定義規(guī)則,如果這項功能在微博上體現(xiàn),那就相當于微博關(guān)注的分類和制定過濾一些微博來源如“皮皮時光機”等源頭發(fā)出的微博。只不過相比郵箱來說微博用戶不一定愿意花時間去設(shè)定那么精準的規(guī)則和關(guān)鍵詞,更何況,微博的媒體屬性也決定了內(nèi)容的千變?nèi)f化和包羅萬象,用戶沒有精力也不會花精力去制定和篩選有價值的信息。 郵箱還有一個功能就是智能過濾垃圾郵件,根據(jù)大多數(shù)用戶的舉報和關(guān)鍵詞以及郵件來源的掃描,一般的郵箱服務已經(jīng)提供了垃圾郵件的過濾功能,甚至能提供很高的判斷率,把垃圾郵件封殺在郵箱之外,另外,QQ 郵箱還有一個類似于智能分組的功能——智能歸檔,在一定的時間積累過后會將你的某些郵件智能歸檔,并且,很多郵箱還提供了郵件的智能排序,將互動和聯(lián)系較多的聯(lián)系人的郵件前面加上重要的標識,這在一定程度上也是對郵件內(nèi)容的整理,如果這個功能遷移到微博上,不就類似與微博的智能排序嗎?只不過是展現(xiàn)方式的不同,算法和驅(qū)動給用戶提供的,是有互動或者內(nèi)容較為高質(zhì)量的,篩選掉的,是有重復性提供的內(nèi)容過載的信息,這至少從功能屬性上說,是對用戶有利的,只是還沒有達到那么智能的程度,所以才會為用戶所詬病。 而在目前看來,如果新浪來制定規(guī)則,對新浪來說非常有利,不管是對于微博信息的監(jiān)管商業(yè)內(nèi)容的推送,好比百度搜索結(jié)果的競價排名。而如果由用戶來制訂,在一定程度上用戶的關(guān)注分組已經(jīng)實現(xiàn)了這樣的功能,但是大部分用戶不會設(shè)置關(guān)鍵詞篩選或者排序機制來優(yōu)化自己的時間線內(nèi)容。 所以,這是一個功能型的硬需求,只不過微博在功能的完成上,還有很長的路要走。當然,這個問題不僅僅是微博一家需要面對和考量的問題,同類網(wǎng)站甚至于社交類屬性的網(wǎng)站都會面臨這樣的問題,如果能有良好的技術(shù)解決類似于時間線的相關(guān)性排序及搜索方面的問題,將會出現(xiàn)一個類似于當年 Google PageRank 加權(quán)算法那樣革命性的技術(shù),以此來奠定 Web2.0 網(wǎng)站的高效使用及商業(yè)化基礎(chǔ)。這會是一個突破性的創(chuàng)新,當然,在信息的質(zhì)量和時間線權(quán)衡上面,也要做出相應的權(quán)衡。 本文出自:億恩科技【www.czbl888.cn】 |