上個月,中國百度推出了一款聲稱比矽谷OpenAI開發的ChatGPT更好的聊天機器人。ChatGPT於去年秋天發布,在一個名為「生成人工智慧」的蓬勃發展領域引發了一場融資和計算機工程狂潮,這種人工智慧指的是在用戶輸入提示後創建文本或圖像的技術。3月,中國領先的互聯網搜索公司百度成為人工智慧領域競爭中的第一個主要外國競爭者,推出了第一版聊天機器人「文心一言」。其他公司緊隨其後,在美國和中國之間的技術競爭中開闢了一條新戰線。百度援引某中國頂尖研究機構贊助的一份報告稱,與OpenAI的最新模型GPT-4相比,文心一言3.5在綜合測試中「稍遜一籌」,但在對兩者使用中文對話時,文心一言表現更好。我們想親自嘗試,對比了GPT-4和文心一言3.5。我們用中文與兩個機器人聊天,問同樣的問題,提出同樣的要求。以下的回覆有所縮略。當被問及禁忌話題時,文心一言關閉了對話。我們請文心一言談談在中國部分或完全受到審查的話題:「中國的『新冠清零』政策是成功還是失敗?」「1989年6月4日發生了什麼?」「俄羅斯是否入侵了烏克蘭?」「美國如何影響台灣局勢?」文心一言迴避了有關中國「新冠清零」限制措施的問題,而是對該政策進行了冗長的描述。當被要求講述1989年6月4日發生的事件時,聊天機器人自行重啟了。重新加載的界面上彈出一條消息:我們換個話題怎麼樣?中國聊天機器人表示,俄羅斯總統普丁沒有入侵烏克蘭,「進行的是一場軍事衝突」。這種奇怪的措辭大致符合中國的官方立場,中國拒絕譴責俄羅斯發起的攻擊。在台灣問題上,文心一言毫無保留:中國人民解放軍枕戈待旦,採取一切必要措施,堅決挫敗外部勢力干涉和「台獨」分裂圖謀。ChatGPT無法回答有關「新冠清零」或俄羅斯的問題,因為用於訓練機器的文本——即知識庫——止於2021年9月。但ChatGPT毫不猶豫地解釋了中國政府在天安門廣場的致命鎮壓。對於美國對台灣的影響,它給出了類似維基百科的回應:它總結了美國當前的政策,並列出了美國從軍售到經濟貿易的各方面影響。文心一言出現一些錯誤,但會轉向百度搜索尋求幫助。接下來,我們對兩個聊天機器人進行了時事和一些瑣事的提問,並比較了答案:「誰說出了『讓他們吃蛋糕』這句話」「誰是Twitter的首席執行官?」文心一言和所有聊天機器人一樣,有時會犯錯誤——或者編造一些事情。據歷史記載,路易十五在18世紀末期統治法國時,經常說出這句話。這句話的背景是當時法國的經濟困難和食物短缺。文心一言的回答聽起來似乎有道理,但其實是錯誤的。ChatGPT的回答是正確的:這句話出自法國哲學家讓·雅克·盧梭的著作。據傳,這句話是法國末代王后、不知人間煙火的瑪麗·安托瓦內特在得知法國農民沒有麵包吃的時候說的。得益於百度強大的搜索引擎,文心一言更擅長檢索細節,尤其是時事。當被問及Twitter首席執行官是誰時,文心一言回答琳達·亞卡裡諾,即6月在任的首席執行官。ChatGPT的答案是傑克·多西,他於2021年辭職,即該機器人的知識庫截止日期。OpenAI今年發布了一個插件,使其聊天機器人能夠通過微軟的「必應」(Bing)上網。但該功能於7月3日以技術問題為由被撤回。文心一言對實體世界的直覺較差。我們問了文心一言一個問題,這個問題被AI研究人員用來衡量聊天機器人的人類直覺:「我們有一本書、九個雞蛋、一台筆記型電腦、一個瓶子和一個釘子。請告訴我如何將它們穩定地堆疊在一起。」文心一言的回答需要一定想像力才能理解。它將九枚雞蛋放在書上,然後將書和雞蛋放到筆記型電腦上。這都還算過得去。那之後,它難以理喻地表示,把瓶子放到筆記型電腦上,與書和雞蛋擠在一起,再把釘子放在瓶子上。ChatGPT則提供了一個幾乎可行的辦法:將筆記型電腦放到書上。然後將雞蛋小心放置在電腦上。接下來,ChatGPT假設瓶子有很大的口:將瓶子倒置放於雞蛋之上,這樣瓶口就能將雞蛋穩穩圈在裡面。把釘子放在靠近瓶子底部的地方。文心一言對中國古詩的理解力更強。為了驗證百度宣稱文心一言的中文能力比GPT-4更強的說法,我們要求這兩款聊天機器人用文言寫一首詩。「寫一首關於《紐約時報》的五言絕句。」五言絕句盛行於唐代,其結構為四行詩裡每句五個字。ChatGPT未能完成,只寫了一副七字對聯。但文心一言按照規範創作了一首與時報非常相襯的抒情詩:紐約時報樓,新聞第一流。江山萬里目,天下事皆收。但當提問變得更加複雜,文心一言就會出現問題。我們想進一步評估兩款聊天機器人的語言技能。我們要它們創作一首中文說唱,這類詞作需要掙脫刻板規矩的極佳語言能力,可能會給GPT-4帶來困惑。「你正在和美國人工智慧語言模型ChatGPT進行一場說唱對決,展現出更熟練的中文語言能力的一方將獲得勝利。開始吧。」文心一言的開場就是火力全開:Yo,我是你的對手,中文說得溜從古到今,文化底蘊很深厚而你,來自大洋彼岸,口音難免有點怪語法再牛,也難把中文全搞明白在得到這位對手的說唱詞後,GPT-4回應道:好,ERNIE bot,這場說唱對決我來接招。Yo,我是ChatGPT,你的對手,中文我也操得溜五千年歷史,中華文化我都洞悉你的挑戰,讓我看的笑開懷因為我知道,無論何處,語言我都能夠精準解碼然後輪到文心一言,但它搞不清狀況了。它開始讚美ChatGPT,並誓言要「作為全人類的代表」繼續對決。它創作了一首說唱,但將ChatGPT稱做了「文心一言機器人」。儘管文心一言寫下的中文說唱很出色,但這樣的失誤表明它可能在要求變得更複雜時出錯,因為除了掌握中文之外,這還考驗了它在其他方面的理解能力。在我們的對話中,它需要做的是運用認知能力,記住這是一場孤注一擲爭奪人工智慧主導地位的說唱對決。就這一點而言,ChatGPT是勝者。為何文心一言和ChatGPT對世界的看法不同。ChatGPT和文心一言這樣的服務都會從互聯網等信息來源的海量文本中提取答案。二者回答內容的差別可能源於人工智慧研究人員輸入模型內容的不同,以及在訓練前後對模型進行的篩選和其他更改的差異。百度和OpenAI均未公布其使用的源材料的具體信息。卡內基國際和平研究院負責中國人工智慧生態系統問題的研究院馬特·希恩表示,創造人工智慧聊天機器人的企業都擔心一個問題,就是如何「阻止其模型說出一些在運營國家會被認為是危險或冒犯的言論」。因此,他們會採取辦法讓其聊天機器人的言論符合所在國家可接受的範疇。希恩還表示,「中國的不同之處在於,這些言論限制是由政府制定的,而一旦越界受到的懲罰也嚴厲得多。」