Internet Develppment
      互聯網開發& 推廣服務提供商

      我們擅長商業策略與用戶體驗的完美結合。

      歡迎瀏覽我們的案例。

      首頁 > 新聞中心 > 新聞動態 > 正文

      研究人員表示 Twitter開源推薦算法省略了重要細節

      發布時間:2023-04-07 16:32:50來源:網易科技


      圖片來自網絡/侵刪
        上周推特兌現了埃隆?馬斯克 (Elon Musk) 長期以來的承諾,在 GitHub 上公布了部分推薦算法底層代碼。然而,研究人員表示,其中的內容并不詳盡,推特省略了“算法到底是如何工作的”等重要細節,使得我們想要弄清推特平臺內部運作機制仍然很困難。

        以下是翻譯內容:

        當馬斯克第一次提出要接管推特時,就宣稱他接手后的第一件事就是“開源”推特算法。上周,他終于履行了自己的承諾,推特在 GitHub 上發布了平臺上有關“為你推薦”功能的部分底層代碼。

        人們很快開始對這些代碼進行深挖,沒過多久就發現馬斯克的推文有特殊類別標記。推特工程師們急忙站出來解釋說,這是為了便于“跟蹤統計”,其他分析也證實了這一說法。盡管推特幾個小時后就從 GitHub 上刪除了這段代碼,但人們仍然猜測推特工程師們特別優待馬斯克所發內容,可能采取了人為措施來提升他的推文曝光量。

        自此之后,推特沒有發布更多代碼,也沒有說明其平臺算法的內部運作機制。那些希望通過推特公開代碼來探究平臺內部運作機制的人可能會感到失望。研究過這些算法的工程師們表示,這是因為推特發布的代碼省略了“算法”到底是如何工作的等關鍵細節。

        據紐約大學研究社交媒體的副教授、前推特員工索爾?梅辛(Sol Messing)稱,推特所公開的內容對推特算法進行了“大量編輯”,其中首要問題就是沒有涵蓋在推特推薦功能中能發揮作用的所有系統。

        推特表示,它沒有公開用于處理廣告的代碼、信任和安全系統,以防止不良行為者利用這些代碼進行惡意操作。此外,推特還選擇不公布用于訓練算法的底層模型,并在一篇博客文章中解釋稱,這是為了“確保用戶的安全和隱私得到保護”。梅辛認為,這個決定甚至更為重要。“算法的最關鍵部分 —— 驅動模型仍沒有開源,”他說,“因此,算法最為核心的部分仍然讓人費解。”

        馬斯克最初開源推特算法的動機似乎源于他對推特利用算法壓制言論自由的擔憂。他在去年四月份的 TED 演講中說:“我認為推特應該開源算法,公開對推文內容的任何更改 —— 無論是推薦還是不推薦 —— 都應該明明白白地呈現出來。這樣,任何人都可以看到推特采取了哪些措施,就不會有任何算法或人工的幕后操作。”這一演講是馬斯克確認收購推特后不久做的。

        在推特發布的代碼中,沒有提供足夠的信息來告訴人們這個平臺是否存在潛在的偏見,也沒有提供內容來說明是否存在馬斯克想要公開的那種“幕后操縱”手段。梅辛說:“這只是透明度的做法。”“但是這些內容并沒有真正幫助人們深入了解算法的運作,也沒有讓人真正深入了解為什么有些人的推文排名會下降,而其他人的排名會上升。”

        此外,梅辛還指出,推特最近在調整其應用程序編程接口(API)方面的政策,這基本上切斷了絕大多數研究人員訪問大量推特平臺數據的途徑。沒有合適的 API 訪問權限,研究人員根本無法自行研究推特算法的新細節。梅辛在自己的分析中寫道:“在推特公布這些代碼的同時,這種做法使得研究人員更難深入分析代碼內容。”

        去年,在馬斯克首次討論“開源”推特算法的計劃后不久,分布式人工智能研究所 (DAIR) 研究總監亞歷克斯?漢納 (Alex Hanna) 也提到了研究人員審查代碼的重要性。和梅辛一樣,她也認為僅在 GitHub 上發布代碼并不足以提高推特運作方式的透明度。

        漢納說:“如果你真的對公眾監督推特算法等事情感興趣,那就必須采取多種方法。”

        不過,推特在 GitHub 上公開的部分代碼確實揭示了推特算法的一些內容。梅辛透露,數據科學家杰夫?艾倫 (Jeff Allen) 從中挖掘出一份文件,其中的內容揭示推特如何使用“公式”為不同類型的用戶參與賦予優先級。梅辛寫道:“如果我們從字面上理解,就會發現推特上的 1 個贊相當于半個推文轉發。”“一條回復相當于 27 次轉發,而 1 條回復再加上推文作者的回應就相當于 75 次轉發。”

        雖然這在一定程度上揭示了一些信息,但有關推特平臺的運作方式的描述并不完整。梅辛說:“沒有實際數據的話,這種分析沒有多少意義。”“如今馬斯克讓學者獲取數據的成本高得離譜。如果他們現在真的想研究這個問題,基本上每年需要花費 50 萬美元(當前約 344 萬元人民幣)的巨資才能獲得大量有意義的數據。”
        (碼上科技

      最新資訊
      ? 2018 河北碼上網絡科技有限公司 版權所有 冀ICP備18021892號-1   
      ? 2018 河北碼上科技有限公司 版權所有.
      主站蜘蛛池模板: 亚洲区精品久久一区二区三区 | 尤物精品视频一区二区三区| 濑亚美莉在线视频一区| 麻豆AV一区二区三区久久| 少妇激情AV一区二区三区| 亚洲av成人一区二区三区 | 国产av天堂一区二区三区| 国产情侣一区二区三区| 国模少妇一区二区三区| 97久久精品一区二区三区| 精品成人av一区二区三区| 国产伦精品一区二区| 亚洲一区二区三区香蕉| 无码AV动漫精品一区二区免费| 中文字幕一区二区免费| 无码人妻AⅤ一区二区三区水密桃 无码欧精品亚洲日韩一区夜夜嗨 无码毛片一区二区三区中文字幕 无码毛片一区二区三区视频免费播放 | 国产精品福利一区| 国产高清精品一区| 国产AV午夜精品一区二区三区 | 亚洲综合在线一区二区三区| 国产福利酱国产一区二区| 亚洲乱码一区av春药高潮| 色欲综合一区二区三区| 久久免费区一区二区三波多野| 国产亚洲欧洲Aⅴ综合一区| 免费无码毛片一区二区APP| 亚洲av无码不卡一区二区三区 | 日本一区二区三区在线视频| 精品一区二区三区四区在线| 波多野结衣电影区一区二区三区 | 国产午夜毛片一区二区三区| 久久精品国产第一区二区| 国产一区二区三区精品视频| 精品一区二区三区在线观看| 色狠狠一区二区三区香蕉蜜桃| 中文字幕无码一区二区免费| 亚洲国产日韩一区高清在线| 亚洲国产系列一区二区三区| 天天看高清无码一区二区三区| 麻豆视频一区二区三区| 国产午夜三级一区二区三|