文章內(nèi)容

微博智能排序的一些思考

發(fā)布時間: 2012/8/6 11:20:54

最近，新浪微博信息流默認排序方式從一開始的“按時間排序”更改為“智能排序”，其實智能排序這個功能早在6月18號就推出來了，只不過當時沒有強制推送，并且入口不明顯，沒有引起大家重視，在最近新浪強制推送之后，引起了很多用戶的反感，各種猜測和吐槽也隨之而來，有人覺得這是強奸了用戶，有人覺得這是要商業(yè)化的前奏，甚至把這個問題類比于百度搜索的競價排名。

　　極客公園不參與吐槽，也不會去爭執(zhí)，僅就現(xiàn)象的問題去挖掘一些本質(zhì)，供讀者參考。

　　微博的信息梳理

　　微博的短板處理——信息過載

　　微博的智能排序，按照官方的說法是可以根據(jù)關(guān)注、標簽和微博內(nèi)容等相關(guān)信息，幫助用戶梳理微博內(nèi)容，對同類微博進行合并、對可能感興趣的微博內(nèi)容進行優(yōu)先展示的排序功能。

　　先拋開大家所懷疑的商業(yè)目的或者內(nèi)容的審查和其它，這至少說明一個問題，微博自己也已經(jīng)意識到了自己的內(nèi)容的重復性造成的信息過載，這是所有UGC網(wǎng)站的共同問題，解決時間線無效信息過多造成的信息過載。

　　知乎上的知友提出了 Facebook 的參考樣本：

　　信息過載之后，選擇“數(shù)據(jù)算法”來“優(yōu)化”信息質(zhì)量，是web上常見的一種方式。Facebook著名的News Feeds開創(chuàng)了NFO( News Feeds Optimization)，也一直飽受非議。這背后的關(guān)鍵問題是：到底什么樣的信息才是重要的?根據(jù)關(guān)系?根據(jù)算法?根據(jù)我的點擊?

　　通過算法來計算信息的重要性，是人類典型的無知：我們知道的越多，我們越無知。信息的重要性完全是人的直覺的感受，非常動態(tài)，無法計算。這或許也是人類其實值得驕傲的地方。

　　智能排序表面上會打亂信息排序，但是我不覺得用戶會對此有明確的感知，畢竟信息太多，并且還是互相斷裂的，時間的秩序感并不是那么重要。

　　我不覺得新浪微博的智能排序有什么陰謀，這其實是業(yè)界常規(guī)的一種處理方式。

　　在功能上，微博在智能排序上做了改進，只是由于新浪的強推，才會讓用戶覺得反感，微博在新功能的推送和引導方面，還有很大的改進空間。

　　時間線和信息流的整理的規(guī)則制定

　　對用戶 Timeline 的梳理，把對用戶更有價值的內(nèi)容優(yōu)先展示，這個是對抗垃圾內(nèi)容獲取微博信息價值的一種好辦法，從出發(fā)點和優(yōu)化微博的媒體屬性來說不見得是一件壞事，其實最大的爭議就是該由誰來制定整理和排序的規(guī)則。

　　假如把微博比喻為郵箱，當做你所有信息的收件箱，那么郵箱有一種情況，就是用戶通過設(shè)置不同的關(guān)鍵詞和規(guī)則將不同的郵件進行了分類整理，方便查找和處理郵件的內(nèi)容，這屬于用戶自定義規(guī)則，如果這項功能在微博上體現(xiàn)，那就相當于微博關(guān)注的分類和制定過濾一些微博來源如“皮皮時光機”等源頭發(fā)出的微博。只不過相比郵箱來說微博用戶不一定愿意花時間去設(shè)定那么精準的規(guī)則和關(guān)鍵詞，更何況，微博的媒體屬性也決定了內(nèi)容的千變?nèi)f化和包羅萬象，用戶沒有精力也不會花精力去制定和篩選有價值的信息。

　　郵箱還有一個功能就是智能過濾垃圾郵件，根據(jù)大多數(shù)用戶的舉報和關(guān)鍵詞以及郵件來源的掃描，一般的郵箱服務已經(jīng)提供了垃圾郵件的過濾功能，甚至能提供很高的判斷率，把垃圾郵件封殺在郵箱之外，另外，QQ 郵箱還有一個類似于智能分組的功能——智能歸檔，在一定的時間積累過后會將你的某些郵件智能歸檔，并且，很多郵箱還提供了郵件的智能排序，將互動和聯(lián)系較多的聯(lián)系人的郵件前面加上重要的標識，這在一定程度上也是對郵件內(nèi)容的整理，如果這個功能遷移到微博上，不就類似與微博的智能排序嗎?只不過是展現(xiàn)方式的不同，算法和驅(qū)動給用戶提供的，是有互動或者內(nèi)容較為高質(zhì)量的，篩選掉的，是有重復性提供的內(nèi)容過載的信息，這至少從功能屬性上說，是對用戶有利的，只是還沒有達到那么智能的程度，所以才會為用戶所詬病。

　　而在目前看來，如果新浪來制定規(guī)則，對新浪來說非常有利，不管是對于微博信息的監(jiān)管商業(yè)內(nèi)容的推送，好比百度搜索結(jié)果的競價排名。而如果由用戶來制訂，在一定程度上用戶的關(guān)注分組已經(jīng)實現(xiàn)了這樣的功能，但是大部分用戶不會設(shè)置關(guān)鍵詞篩選或者排序機制來優(yōu)化自己的時間線內(nèi)容。

　　所以，這是一個功能型的硬需求，只不過微博在功能的完成上，還有很長的路要走。當然，這個問題不僅僅是微博一家需要面對和考量的問題，同類網(wǎng)站甚至于社交類屬性的網(wǎng)站都會面臨這樣的問題，如果能有良好的技術(shù)解決類似于時間線的相關(guān)性排序及搜索方面的問題，將會出現(xiàn)一個類似于當年 Google PageRank 加權(quán)算法那樣革命性的技術(shù)，以此來奠定 Web2.0 網(wǎng)站的高效使用及商業(yè)化基礎(chǔ)。這會是一個突破性的創(chuàng)新，當然，在信息的質(zhì)量和時間線權(quán)衡上面，也要做出相應的權(quán)衡。

本文出自：億恩科技【www.czbl888.cn】

服務器租用/服務器托管中國五強！虛擬主機域名注冊頂級提供商！15年品質(zhì)保障！--億恩科技[ENKJ.COM]

上一篇 >> 云計算初期泡沫并不可怕產(chǎn)業(yè)模式趨于明晰
下一篇 >> 云計算：馬云眼力毒辣李彥宏承認是“新酒”

服務器租用

服務器托管

機柜批發(fā)

云服務器

建站俠

空間/域名

安全保姆

幫助類別

幫助中心

文章內(nèi)容

微博智能排序的一些思考

同類文章

億恩公告

在線客服