哈拉機器人一直是人工智障的代表。
盡管從GPT-3開始,AI生成的文本已經能做到以假亂真,但這僅限于生成一段話。
在連續哈拉中,AI不會記得自己之前說過的話,就像下面這樣:
AI這種前后矛盾的表現,在人類看來就是沒有穩定的身份和個性,好像聊著聊著換人了,也難怪一直被當作人工智障,
現在,Facebook AI團隊終于推出BlenderBot2.0,在1.0基礎上添加了長期記憶和即時搜索功能。
首先要記住自己說過的話:
記下自己說過的“我喜歡很多種音樂”,和“Kanye West是我最喜歡的說唱歌手”這樣的資訊,避免后續哈拉中出現矛盾,
人類說的話也要記住,比如最喜歡的專輯:
最后,如果人類提到了AI不知道的東西怎么辦?
趁沒人發現悄悄去網上搜索,還能把搜出來的資訊顯擺出來:
查到對方喜歡的藝人Beyonce的出生地,并用“我去過那里幾次”接上對話,
是不是像極了在群里哈拉吹水時偷偷百度的你?
如何告別智障
Facebook AI去年發布的BlenderBot1.0就已經做到了94億參數,在單輪對話生成上取得了出色的效果,
這次升級的重點是一個檢索增強算法,能從過去對話記憶和互聯網上的資料中提取出能用在當前對話的資訊。
對于訓練數據,Facebook在眾包平臺上發布了任務,
讓參與者在對話中扮演一個特定的人格,并隔幾小時、隔幾天對同一個話題進行討論,收集成多輪對話數據集。
AI從網上搜索資料并用于哈拉的能力,也是從人類那里學來的。
同樣是在眾包平臺上,這次的任務是讓一個人描述自己的興趣開啟話題,另一個人可以上網搜索并接上對話。
這樣AI不僅能學到人類在面對不同話題的適合搜索什么關鍵詞,還能學到最后什么樣的資訊可以用在哈拉上。
實驗結果上,BlenderBot2.0對之前對話內容的使用率提高了55%,在對話中的事實一致性提高了12%,而人類評估員打出的分數提高了17%。
能上網搜索資訊還讓AI能夠參與人類世界中最新的話題,比如談論新上映的電視劇,
如果和BlenderBot1.0聊起今年新片《旺達幻視》,他只能說我沒看過,這天就聊死了。
Blender2.0就可以搜索后說出片中最喜歡的角色是誰,讓人更有把對話繼續下去的欲望,
AI的記憶不再靜止于它完成訓練的那一刻。
LeCun點贊,馬斯克擔憂它的三觀
三巨頭之一的LeCun第一時間轉發了BlenderBot2.0并評價為“首個能對任意話題Hold住多輪對話的哈拉機器人”
馬斯克所擔心的,是AI從開放互聯網上獲取資訊很快會變得三觀不正,
他舉的例子是微軟推出的Tay機器人在16小時左右就被網友聊成了納粹支持者,最后被迫下架。
對于和AI討論“最喜歡的作品”這回事,有人表現出了不信任:
AI不會喜歡某個作品,只是自動把最流行的作品當成最好的,和網上追逐熱點的大多數人一樣,
有人看出了潛在的隱私風險:
你們說讓AI上網搜索,不會是在Facebook上搜索我發的帖子吧,
如果你感興趣,可以到Facebook的Parlai平臺下載模型和它聊聊看,