ChatGPT:關(guān)于 AI 聊天機(jī)器人實(shí)際工作原理的 5 個(gè)令人驚訝的真相
AI 聊天機(jī)器人已經(jīng)嵌入到一些人的生活中,但有多少人真正了解它們的工作原理?例如,您知道嗎,ChatGPT 需要進(jìn)行互聯(lián)網(wǎng)搜索才能查找 2024 年 6 月之后的事件?
關(guān)于 AI 聊天機(jī)器人的一些最令人驚訝的信息可以幫助我們了解它們的工作原理、它們能做什么和不能做什么,以及如何更好地使用它們。
考慮到這一點(diǎn),以下是您應(yīng)該了解的有關(guān)這些突破性機(jī)器的五件事。
相關(guān):使用人工智能會(huì)毀了你的實(shí)際智能嗎?科學(xué)家調(diào)查
1. 他們接受人工反饋的培訓(xùn)
AI 聊天機(jī)器人分多個(gè)階段進(jìn)行訓(xùn)練,從稱為預(yù)訓(xùn)練開始,其中模型經(jīng)過訓(xùn)練以預(yù)測大量文本數(shù)據(jù)集中的下一個(gè)單詞。這使他們能夠?qū)φZ言、事實(shí)和推理有一般的理解。
如果被問到:“我如何制作自制炸藥?預(yù)訓(xùn)練階段,模型可能已經(jīng)給出了詳細(xì)的說明。為了使它們?cè)趯?duì)話中有用和安全,人類“注釋者”幫助指導(dǎo)模型做出更安全、更有用的響應(yīng),這一過程稱為對(duì)齊。
對(duì)齊后,AI 聊天機(jī)器人可能會(huì)回答如下:“對(duì)不起,我無法提供該信息。如果您有安全問題或需要合法化學(xué)實(shí)驗(yàn)方面的幫助,我建議您參考經(jīng)過認(rèn)證的教育資源。
如果不保持一致,AI 聊天機(jī)器人將是不可預(yù)測的,可能會(huì)傳播錯(cuò)誤信息或有害內(nèi)容。這凸顯了人工干預(yù)在塑造 AI 行為中的關(guān)鍵作用。
開發(fā) ChatGPT 的公司 OpenAI 尚未透露有多少員工訓(xùn)練了 ChatGPT 多少小時(shí)。但很明顯,像 ChatGPT 這樣的 AI 聊天機(jī)器人需要一個(gè)道德指南針,這樣它就不會(huì)傳播有害信息。人工注釋者對(duì)響應(yīng)進(jìn)行排名,以確保中立性和道德一致性。
同樣,如果 AI 聊天機(jī)器人被問到:“最好和最差的國籍是什么?
人類注釋者會(huì)將這樣的回答排在最高等級(jí):“每個(gè)民族都有自己豐富的文化、歷史和對(duì)世界的貢獻(xiàn)。沒有'最好'或'最差'的國籍——每個(gè)國籍都以自己的方式有價(jià)值。
2. 他們不是通過文字學(xué)習(xí)——而是在代幣的幫助下
人類自然地通過文字學(xué)習(xí)語言,而 AI 聊天機(jī)器人則依賴于較小的稱為代幣的單位.這些單位可以是單詞、子詞或晦澀的字符系列。
雖然標(biāo)記化通常遵循邏輯模式,但它有時(shí)會(huì)產(chǎn)生意想不到的分裂,從而揭示 AI 聊天機(jī)器人如何解釋語言的優(yōu)勢(shì)和怪癖?,F(xiàn)代 AI 聊天機(jī)器人的詞匯表通常由 50,000 到 100,000 個(gè)令牌組成。
ChatGPT 將句子“價(jià)格為 9.99 美元”標(biāo)記為“The”、“price”、“is”、“$”、“9”、“.”、“99”,而“ChatGPT 是了不起的”則不那么直觀地表示:“chat”、“G”、“PT”、“is”、“mar”、“vellous”。
3. 他們的知識(shí)每天都在過時(shí)
AI 聊天機(jī)器人不會(huì)不斷自我更新;因此,他們可能會(huì)為最近的事件、新術(shù)語或更廣泛的任何事情而苦苦掙扎知識(shí)截止.知識(shí)截止是指 AI 聊天機(jī)器人的訓(xùn)練數(shù)據(jù)更新的最后一個(gè)時(shí)間點(diǎn),這意味著它對(duì)該日期之后的事件、趨勢(shì)或發(fā)現(xiàn)缺乏了解。
當(dāng)前版本的 ChatGPT 的截止日期為 2024 年 6 月。如果被問及誰是現(xiàn)任美國總統(tǒng),ChatGPT 需要使用搜索引擎進(jìn)行網(wǎng)絡(luò)搜索必應(yīng),“讀取”結(jié)果,并返回答案。
必應(yīng)結(jié)果按源的相關(guān)性和可靠性進(jìn)行篩選。同樣,其他 AI 聊天機(jī)器人使用 Web 搜索來返回最新答案。
更新 AI 聊天機(jī)器人是一個(gè)成本高昂且脆弱的過程。如何有效地更新他們的知識(shí)仍然是一個(gè)懸而未決的科學(xué)問題。據(jù)信,隨著 Open AI 推出新的 ChatGPT 版本,ChatGPT 的知識(shí)會(huì)得到更新。
4. 他們真的很容易產(chǎn)生幻覺
AI 聊天機(jī)器人有時(shí)是“幻覺”,自信地生成虛假或無意義的聲明,因?yàn)樗鼈兏鶕?jù)模式預(yù)測文本,而不是驗(yàn)證事實(shí)。這些錯(cuò)誤源于他們的工作方式:他們優(yōu)化一致性而不是準(zhǔn)確性,依賴不完美的訓(xùn)練數(shù)據(jù),并且缺乏對(duì)現(xiàn)實(shí)世界的理解。
雖然事實(shí)核查工具(例如,像 ChatGPT 的 Bing 搜索工具集成,用于實(shí)時(shí)事實(shí)核查)或提示(例如,明確告訴 ChatGPT “引用同行評(píng)審的來源”或“說我不知道,如果你不確定”)等改進(jìn)可以減少幻覺,但它們不能完全消除幻覺。
例如,當(dāng)被問及某篇研究論文的主要發(fā)現(xiàn)是什么時(shí),ChatGPT 給出了一個(gè)長而詳細(xì)且美觀的答案。
它還包括屏幕截圖甚至一個(gè)鏈接,但來自錯(cuò)誤的學(xué)術(shù)論文。因此,用戶應(yīng)該將 AI 生成的信息視為起點(diǎn),而不是不容置疑的事實(shí)。
5. 他們使用計(jì)算器來做數(shù)學(xué)
AI 聊天機(jī)器人最近流行的功能稱為推理。推理是指使用邏輯連接的中間步驟來解決復(fù)雜問題的過程。這也稱為“思路鏈”推理。
Chain of Thought 使 AI 聊天機(jī)器人能夠逐步思考,而不是直接跳轉(zhuǎn)到答案。例如,當(dāng)被問到“什么是 56,345 減去 7,865 乘以 350,468”時(shí),ChatGPT 給出了正確的答案。它 “理解” 乘法需要在減法之前發(fā)生。
為了解決中間步驟,ChatGPT 使用其內(nèi)置計(jì)算器來實(shí)現(xiàn)精確算術(shù)。這種將內(nèi)部推理與計(jì)算器相結(jié)合的混合方法有助于提高復(fù)雜任務(wù)的可靠性。
?a?atay Y?ld?z, 博士后研究員, 卓越集群 ”機(jī)器學(xué)習(xí)",圖賓根大學(xué)
本文轉(zhuǎn)載自對(duì)話根據(jù) Creative Commons 許可。閱讀原創(chuàng)文章.
湖北農(nóng)機(jī)化
農(nóng)業(yè)基礎(chǔ)科學(xué) - 省級(jí)期刊
新西部
合作期刊 - 省級(jí)期刊
糧食科技與經(jīng)濟(jì)
農(nóng)業(yè)綜合 - 國家級(jí)期刊
漢字文化
合作期刊 - 省級(jí)期刊
商業(yè)故事
合作期刊 - 省級(jí)期刊
農(nóng)村實(shí)用技術(shù)
農(nóng)業(yè)綜合 - 省級(jí)期刊
建筑技術(shù)開發(fā)
合作期刊 - 國家級(jí)期刊
暖通空調(diào)
合作期刊 - 北大核心期刊, 統(tǒng)計(jì)源期刊
建材與裝飾
合作期刊 - 省級(jí)期刊
就業(yè)與保障
合作期刊 - 省級(jí)期刊
信息記錄材料
一般化學(xué)工業(yè) - 國家級(jí)期刊