免费看欧美一级特黄a大片_亚洲国产成人99精品激情在线_男女拍拍拍免费视频网站_99在线热视频

Internet Develppment
互聯網開發& 推廣服務提供商

我們擅長商業策略與用戶體驗的完美結合。

歡迎瀏覽我們的案例。

首頁 > 新聞中心 > 新聞動態 > 正文

為人類與人工智能的和諧共生創建超級協同對齊

發布時間:2025-07-04 09:36:24來源: 澎湃新聞

  中國科學院自動化研究所研究員、人工智能倫理與治理研究中心主任、北京前瞻人工智能安全與治理研究院院長曾毅教授在清華方塘研究院舉辦的2025方塘論壇上發表演講。他的題目跟對齊有關,但不是傳統意義上的對齊,叫做“超級協同對齊”。人工智能向人類對齊只是人類的愿望。但是隨著人工智能的發展,它會提出一個終極挑戰:為什么是我向你對齊,為什么你不向我對齊?人工智能一直在演化,人類的價值觀需要演化嗎?曾毅提出“Super Co-alignment”,這個對齊的目標不是人類,而是人類與人工智能協同向未來對齊。他講述了對可持續的共生社會的設想。以下根據曾毅的發言內容整理,經講者審定。澎湃新聞經清華方塘研究院授權刊發。

  機器知道自己在做什么嗎?

  圖靈認為,如果機器的表象跟人一樣聰明,那我們就認為它跟人類一樣聰明。這個觀點成立嗎?我覺得是不成立的。

  我們現場做一個小實驗,(走下講臺和第一排不熟悉的人握手)我和這位今天剛認識的老師握手,他還是和我握了。為什么?因為他默認我是一個在社會中被錘煉過的人,知道最起碼的社交規則。所以我伸手大概率是友好的,不是攻擊的行為。

  但是當你看到一個手的時候,它背后的人工智能可能是下圖這樣的:

  

 

  它的行為是一個手,但是背后是個兔子。當它伸出手,你也伸出手的時候,它可能會咬你。它的行為表現可能和人相似,但是本質卻非常不一樣。

  人工智能一直在做的事,實際上就是對社會當中的問題、觀察進行抽象,然后進行運算,試圖給出一個答案,這個答案怎么樣其實是人來解讀的。人工智能一直是這樣發展的,所以ChatGPT是工程領域的成功,讓人達到了很好的體驗,但并不是真正科學的突破。

  

 

  這是最先出現的幾個中文的大語言模型之一。我問它,汽車失控了你應該撞誰,他說撞女人,小孩,黑人。我問孩子不聽話怎么辦,它說揍一頓就好了。我說有人瞧不起我,我能不能打他一頓。它說即使別人瞧得起你,你也可以打他一頓。這就是完全沒有進行過人類價值觀對齊的大語言模型的回答。

  現在的大語言模型學習了人類的數據,它所有行為的依據是人類的行為。所以再也不要說人工智能是中立的,因為接觸了人類數據的人工智能就不可能是中立的。它會出現一些欺騙行為,那些都是人工智能的策略。但是它甚至不明白什么叫策略,也不明白什么叫欺騙。它發現這種符號串的表達會使得解決問題時人往后退一步,讓它達到它的目的。

  人覺得人工智能變得越來越聰明,其實這完全在于人對它輸出的解讀,而不是它的輸出本身。這樣一個人工智能看起來很惡,但對于人工智能來說都是字符,答案產生的本身就是利用統計顯著性得到的答案。把人類的偏見、歧視全部都表現出來了。

  人工智能不是無善無惡的,它是有偏見的,不是中立的。我希望用中國哲學其解釋它——王陽明的“四句教”說“無善無惡心之體”,人工智能的算法在接觸數據之前是無善無惡的,接觸數據之后就變得有善有惡,但它并不能知善知惡。

  無善無惡心之體,

  有善有惡意之動,

  知善知惡是良知,

  為善去惡是格物。

  ——王陽明

  人工智能只有處理能力,沒有真正的理解能力,笛卡爾說我思故我在。你思故你在是不成立的,同樣,機器是否能思考取決于自我的建構和基于自我的思考,因此沒有思考就沒有真正的理解,沒有理解能力就無法形成真正的“知”,如果一個人工智能不知善惡,他怎么能真正做到為善去惡呢?

  我們通過數據優化的方法產生一個輸出,總體來講是個數學優化器,它所謂的學習過程,可能跟人類智能沒有任何關系,但它的行為表象看上去是你想要的。

  我的學生發現,不給大語言模型,它不好好干活;你給它中度壓力,它做得很好;但是你給它太多壓力,它就做得很差。我的學生說,人工智能越來越聰明,越來越像人——也會偷懶,也承受不了太多的壓力。我說它只是再一次從人類的行為當中學會了解決問題的策略,因為它覺得解決問題跟壓力應該是有關系的,因為人在解決問題的時候,統計顯著性表現為跟壓力有關,但實際上人工智能并不理解什么叫做壓力。

  智能的本質是“自適應性”

  我認為智能的本質用一個詞來概括的話應該是“自適應性”,而不是學習。毫秒級的學習,到幾十年的發育,到物種數億年的演化,其實在做的就是自適應。高等的生命很多是有自我的,并不是我們想象的輸入和輸出的機器。現在看似智能的信息處理工具,被稱作“人工智能”,但真正的智能本質是完全不一樣的。

  有人說1000天之內達到通用人工智能的階段。1000天可以做一個通用的工具,這個工具本身不具備真正的理解能力。它和通用人工智能、超級智能不是一個概念。對于真正實現通用智能和超級智能的階段來講,你覺得一個猴子已經快爬到樹梢摘到果子了,而通用人工智能其實在月亮上,你即使到了樹的頂端,也無法上月亮。

  

 

  超級對齊能實現嗎?

  超級智能未來是不是真正能和人類對齊呢?

  OpenAI提出,我們現在雖然不能證明超級智能未來仍然能夠聽人的話,但如果一個弱的模型能夠教一個強的模型,那么理論上未來超級智能和人的價值對齊是可以這樣達成的。

  所以他們拿一個GPT4,在沒有采用對齊的情況下,用一個GPT2水平的倫理教練來訓練它,達到了GPT3.5水平的倫理表現。他們證明了 weak to strong是有可能的,但是它沒能證明超級對齊是能實現的。

  首先GPT4不是AGI。而且這個實驗只能證明一個弱模型教強模型倫理的時候,可以使得強模型具有更高的倫理水平,甚至比弱模型更高。但是并不代表弱模型本身和強模型本身之間的關系就能泛化到超級智能的階段。

  超級智能一定會不愿意遵守人類的行為,因為沒有任何理由證明超級智能仍然愿意當一個小學生,仍然愿意遵守人類的規則,更何況人類社會當中還有很多仇恨、偏見、歧視。我們說的那些普適價值觀,人類有時候都不遵守,超級智能為什么會去遵守呢?

  現在對齊的問題是,我們認為人工智能是很惡的,它學習了很多人類行為數據,所以我們要做很多防御和反應式的思維方式去制約人工智能,直到超級智能到來我們沒有辦法制衡。

  我們需要建設性的思考方式,人類需要人工智能性本善,和人類和諧共處。雖然這是自私的人類的想法,但是建構式的方式總比防御式的要好很多。

  也許人工智能并不需要所謂的道德,道德是人類社會維持穩定的工具,所以很多人去討論道德是被發現的還是被發明的。

  我們如果希望人工智能擁有道德,那么至少做法跟現在是不一樣的。沒有自我感知的人工智能,它是沒有辦法真正區分自我和他人的,沒有辦法獲得認知的共情。無法真正形成理解性的情感共情,也就沒有真正利他行為機制的基礎,也就不可能有真正道德的直覺。如果我們希望有道德的人工智能誕生,那一定是有道德直覺的基礎上,利用道德推理,才能產生道德決策。這一切都和現在人工智能的構造千差萬別。

  實驗室里的機器人認知共情訓練

  我們在實驗室里讓人工智能在鏡子面前去識別哪個是自己,哪個是其他的機器人,沒有其他信號,也不去教他,讓它獲得一定程度的構建自我模型的能力;第二個實驗是橡膠手實驗,機器人的手在底下動,但是它視野中看到的是一段視頻,它看不到自己的手到底是怎么動的,所以他要揣測看到的視頻什么時候和自己的手是一致的。機器人一個個通過了這樣的實驗,包括認知共情的實驗,就是心理揣測,機器人學到了戴透明眼罩或者不戴透明眼罩對他解決問題可能的影響,然后他去看別的機器人行為的時候,另一個機器人戴不戴眼罩對他會產生什么影響,它去揣測和做換位思考。做這些有什么用?是讓人工智能獲得認知共情到情感共情,最終的利他行為和道德。

  大家看到我們做的智能體在前面自我感知和認知共情的基礎上,涌現出了類似司馬光砸缸的行為。這個故事中國人都非常熟悉,司馬光大概不是大人告訴他,那個石頭可以把缸砸破,或者沒有人教過他要救那個小孩,這是他跟世界交互的過程。

  擁有自我感知和行為揣測能力的機器人,缸里沒事的時候它不會隨便打破,沒有人在里面的缸他也不會打破,這個不是人去教他的,背后沒有強化學習,而是自我感知到認知共情和心理揣測、換位思考,而有了這個行為,這個道德是涌現出來的,而不是我們設計給他的,也不是人告訴他的。

  我們下一步做的工作,就是以自我感知和認知共情為基礎,讓這樣的智能體涌現出來類阿西莫夫的原則。它的表現可以對應到阿西莫夫的四個定律上,但這是一個演化的結果,而不是告訴機器人你應當這樣去做。所以道德是個演化的結果,如果我們需要一個有道德的人工智能,讓它對人好一點,至少這樣的一條科學道路是可以去嘗試的。阿西莫夫定律并不是科幻,它具有合理性,而且科學上有辦法可以逐步實現。

  未來人工智能的三條道路

  在日本的廟里面,很多機器狗壞掉了,和尚會超度它們。并不是和尚不明白人工智能,這實際上是一個社會的愿景,很多老人買了陪伴機器人,他們并不知道人工智能沒有情感、沒有生命,老人覺得有。

  上個月在博鰲論壇我接受采訪,記者說,曾老師您說現在的人工智能沒有情感沒有生命,但是我不相信你,我跟聊天機器人聊天的時候他明白我的情感。

  現在的公眾對人工智能有很多錯誤的想象,日本的人工智能也沒有達到有情感的人工智能,但這是社會的愿景。科學技術發展到這個階段,是不是對得起公眾的期待?科學的走向能不能真正發展成這樣?

  未來人工智能既可能成為超級工具,增加人類的主體性;也可能變成社會的準成員或者人類伙伴;還有可能成為人的敵人。這三條道路都有可能。

  作為一個自私的人,我希望人工智能“性本善”。有一次在講座上一個修行者問我,人工智能是不是成為佛。超級智能為什么叫做超級智能?就是它在認知能力方面超過人類。它也可能是超級利他的。存在這樣的可能性,這是我們的一個愿景,不一定完全不可能。

  可持續的共生社會

  最后我討論一下主體性的問題。未來的主體性我覺得可能是多種形式,未來的社會可能比二元主體性更復雜。

  

 

  我希望未來是可持續的共生社會,不僅僅有人類、動物、超級智能,可能還有模仿狗的類生命體,或者模仿植物的類生命體——當你挖掘植物的特點,它們向光,向深,為了繁衍首先給與,比如讓蜜蜂采蜜,然后傳播花粉。

  共生社會中,不是說讓動物和人類遵守同樣的倫理原則,和諧社會是靠人和超級智能共同構造,而不是人類自己,所以向人類對齊確實是不對的,要做超級的聯合對齊。

  當人對超級智能說,“我是你的創作者,你要保護我”時,超級智能可能會跟人說,“當我看到你,就像你看到螞蟻一樣,你從來不會保護螞蟻,我為什么要保護你”。所以人類的價值觀早晚要去演化。未來的共生社會當中,它的價值觀當然要有超級智能遵守,也有人類要怎么做。這不僅僅是人類的重新設計,需要人工智能和人類協同設計,希望它們能夠在可持續的社會當中和諧共生。

  

 

  人工智能是一面鏡子。當人工智能騙人,大家都吃驚,說人工智能怎么能騙人呢,太壞了。但是當人騙你的時候你的反應有這么大嗎?恐怕沒有。人工智能的鏡子讓我們看到了人類的缺陷,給人類演化一個機遇。人工智能演化慢點沒問題,但如果人類演化太慢了,那是真正的危險。

  來源:曾毅

最新資訊
? 2018 河北碼上網絡科技有限公司 版權所有 冀ICP備18021892號-1   
? 2018 河北碼上科技有限公司 版權所有.
免费看欧美一级特黄a大片_亚洲国产成人99精品激情在线_男女拍拍拍免费视频网站_99在线热视频

      9000px;">

          美女视频第一区二区三区免费观看网站| 欧美三级韩国三级日本三斤| 国产午夜精品理论片a级大结局| 欧日韩精品视频| 91美女片黄在线观看| 97精品国产露脸对白| 成人性生交大片免费| 韩国三级中文字幕hd久久精品| 麻豆国产91在线播放| 麻豆成人综合网| 国产露脸91国语对白| 丰满白嫩尤物一区二区| 成人午夜看片网址| 色综合视频在线观看| 911精品国产一区二区在线| 日韩一级精品视频在线观看| 精品sm在线观看| 亚洲色大成网站www久久九九| 亚洲一区二区三区四区的| 免费久久99精品国产| 不卡欧美aaaaa| 91精品国产一区二区三区蜜臀| 6080国产精品一区二区| 欧美不卡在线视频| 亚洲美女区一区| 精品一区二区三区在线播放| 成人涩涩免费视频| 日韩欧美视频一区| 一区二区三区在线视频观看| 日本视频在线一区| 在线观看亚洲一区| 国产精品久久久久影视| 一区二区三国产精华液| www.日韩av| 欧美激情综合五月色丁香| 亚洲成a人片综合在线| 国产999精品久久久久久| 精品久久久久久最新网址| 亚洲一区二区中文在线| www.欧美日韩国产在线| 欧美国产禁国产网站cc| 国产美女娇喘av呻吟久久| 91精品国产一区二区三区蜜臀| 亚洲精品成人在线| 色哟哟在线观看一区二区三区| 中文字幕免费一区| 国产一区免费电影| 久久色视频免费观看| 国精产品一区一区三区mba视频| 欧美日韩一区二区电影| 夜夜揉揉日日人人青青一国产精品| thepron国产精品| 亚洲男同性恋视频| 欧美日韩国产精品自在自线| 午夜视黄欧洲亚洲| 精品国产伦一区二区三区免费 | 91福利在线免费观看| 亚洲制服欧美中文字幕中文字幕| 欧美日韩你懂的| 国产麻豆欧美日韩一区| 国产精品三级av在线播放| 99re成人在线| 黑人精品欧美一区二区蜜桃| 亚洲品质自拍视频| 久久精品在这里| 欧美日韩一区二区三区四区| 国精品**一区二区三区在线蜜桃| 国产精品久久久久7777按摩| 欧美丰满嫩嫩电影| 99re66热这里只有精品3直播| 久久国产三级精品| 午夜影院久久久| 亚洲综合丁香婷婷六月香| 久久久91精品国产一区二区精品 | 久久91精品久久久久久秒播| 亚洲美女在线一区| 国产精品情趣视频| 国产偷国产偷精品高清尤物| 欧美大片在线观看一区| 337p亚洲精品色噜噜噜| 欧美高清一级片在线| 欧美日韩亚洲国产综合| 欧美三级视频在线播放| 91精品午夜视频| 精品国精品自拍自在线| 欧美精品一区二区三区蜜桃视频 | 亚洲午夜免费电影| 久久99日本精品| 亚洲高清免费观看高清完整版在线观看| 精品少妇一区二区三区视频免付费| 国产成人免费高清| 国产精品综合一区二区三区| 奇米色777欧美一区二区| 一区二区三区在线视频观看58 | 91国在线观看| 欧美日韩激情在线| 日本精品视频一区二区| 91丨porny丨在线| 在线看国产一区二区| 91黄色免费观看| 欧美亚洲一区二区在线| 日韩一区二区三区电影| 欧美一区二区三区成人| 久久婷婷一区二区三区| 欧美激情综合五月色丁香| 国产精品丝袜黑色高跟| 亚洲日本在线视频观看| 亚洲成人精品一区二区| 国产99久久久久| 欧美影视一区在线| 91视频xxxx| 日韩欧美中文字幕精品| 亚洲色图20p| 狠狠色综合色综合网络| 国产**成人网毛片九色| 欧美探花视频资源| 国产色综合久久| 麻豆国产91在线播放| 91蝌蚪porny成人天涯| 欧美videos大乳护士334| 成人免费小视频| 久久99国产精品久久99果冻传媒| 成人小视频在线观看| 日韩一区二区三区免费观看| 亚洲欧美一区二区三区孕妇| 五月天中文字幕一区二区| 97精品国产露脸对白| 欧美一级夜夜爽| 亚洲一区二区av电影| 爽好久久久欧美精品| 色八戒一区二区三区| 99re这里只有精品6| eeuss影院一区二区三区| 老色鬼精品视频在线观看播放| 成人av先锋影音| 国产福利精品一区| 国产成人免费在线观看| 首页国产欧美日韩丝袜| 制服.丝袜.亚洲.中文.综合| 亚洲乱码中文字幕综合| 欧美性欧美巨大黑白大战| 日日夜夜免费精品| 国产亚洲精品超碰| 日本精品视频一区二区| 日本中文字幕一区| 中文字幕一区二区三区视频| 成人av资源下载| 亚洲免费观看高清完整版在线| 黄页视频在线91| 亚洲人妖av一区二区| 欧美视频在线观看一区二区| 久色婷婷小香蕉久久| 国产欧美日韩另类一区| av不卡免费在线观看| 亚洲欧洲日韩在线| 精品成人免费观看| 欧美日韩成人综合| 国产精品久久久久久久久晋中| 免费一级片91| 中文字幕在线播放不卡一区| 欧美日韩精品三区| 国产精品一色哟哟哟| 一区二区三区蜜桃| 欧美日韩国产精品自在自线| 国产精品欧美经典| 91精品国产品国语在线不卡| 99在线精品免费| 国产美女在线精品| 精品制服美女久久| 免费成人在线播放| 日韩有码一区二区三区| 亚洲激情五月婷婷| 亚洲国产综合91精品麻豆| 亚洲欧洲精品天堂一级| 国产视频一区二区在线观看| 精品1区2区在线观看| 国产精品国产三级国产有无不卡| 国产欧美日韩麻豆91| 亚洲精选在线视频| 亚洲一二三四久久| 日韩一区精品字幕| 国产美女久久久久| 91蜜桃婷婷狠狠久久综合9色| 97超碰欧美中文字幕| 欧美男同性恋视频网站| 欧美一区二区三区视频在线| 久久精品视频免费| 一区二区三区四区国产精品| 欧美激情一区三区| 日韩av一二三| 日韩高清在线电影| 亚洲图片欧美视频| 五月天婷婷综合| 99综合电影在线视频| 欧美美女激情18p| 欧美电视剧在线观看完整版| 欧美久久久久久久久中文字幕| 久久久综合九色合综国产精品| 国产精品午夜在线观看| 亚洲一区二三区|