OpenAI“草莓”推理大模型兩周內就要上架?用戶恐將面臨耐心考驗
2024-09-11
200
財聯(lián)社9月11日訊(編輯 史正丞)沉寂了數(shù)月的全球AI龍頭OpenAI,似乎馬上要有大動作了。
根據(jù)《信息報》周二援引多名知情人士報道,OpenAI計劃在大約兩周時間里,正式推出以推理能力為核心的“草莓”AI模型,并加入ChatGPT服務。由于OpenAI CEO奧爾特曼等人對“草莓”的大力宣傳,疊加公司的確也有一陣子沒有令人興奮的消息了,外界對于這個新產品也算是有一定的期待。
會主動“沉思”的大模型
報道稱,作為以推理為賣點的大模型,“草莓”在面對復雜、多步驟的提問時,會比現(xiàn)在的GPT-4o能力更強、更加易用。
在使用GPT-4o時,如果要提出一個多步驟推理的問題,為了避免機器胡亂回答,用戶往往需要明確告知機器人解答問題時的每一個推理步驟——類似于輸入“思考鏈的提示詞”。使用“草莓”時則沒有那么麻煩,輸出的結果也會更好。例如,這個模型能夠解答《紐約時報》字謎游戲。
(來源:《紐約時報》)
因此,除了數(shù)學、代碼外,“草莓”也適合回答更加寬泛、主觀的問題。例如要求它“頭腦風暴”一個市場營銷策略,“草莓”給出的回答更加貼近用戶所在的實際場景,也更加關注細節(jié),例如生成一個以周為單位的執(zhí)行計劃。
造成回答質量差異的核心原因,在于“草莓”模型不會立即回答用戶的提問,而是會進行“思考”,也會向用戶提出追加的問題,從而更加全面地給出答案。
當然,這個步驟也是“草莓”作為互聯(lián)網產品的潛在弱點——報道稱,模型可能需要10-20秒的時間才會開始回答問題。對于日益強調與AI實時交流的行業(yè)而言,付費用戶能否接受交互間隔拉大到十秒以上會是個問題。
更致命的問題是,在回答一些GPT-4o也能推理的問題(事實上人類至今都不清楚AI的能力邊界在哪里),“草莓”可能會出現(xiàn)思考一段時間后,只給出稍稍好一些的回答。體驗過這種差異的知情人士稱,結果的提升并不值得等待這么長時間,能做到“脫口而出”的GPT-4o反而體驗更好。
知情人士同時表示,在內部測試中,“草莓”也出現(xiàn)難以記住對話歷史等問題。同時這個模型目前只能輸入和輸出文字,并不能處理圖像,尚未跨過關鍵的多模態(tài)門檻。
商業(yè)策略也是看點
即使爆料準確,這件事情的看點除了“草莓”本身的能力外,還有OpenAI對商業(yè)策略的考量。
根據(jù)早些時候的報道,OpenAI在內部商討中,考慮給即將推出的推理專長“草莓”大模型,或下一代旗艦模型Orion訂一個更高的價格。更符合實際的操作是,OpenAI可能會在現(xiàn)有的ChatGPT Plus外新增一個付費檔次,提供“草莓”的無限制訪問或響應速度提升。當然,這一切的前提是有大量用戶認可“草莓”能力的提升。
在目前的定價體系中,面向個人用戶的ChatGPT Plus每月收費20美元,企業(yè)用戶的收費標準介于每月25-60美元/每個賬號不等。
上個月曾經有消息稱,OpenAI每月能通過企業(yè)服務和ChatGPT訂閱賺到2.83億美元的收入,但公司層面依然處于凈虧損的狀態(tài)。