熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
法院系統表示,幻覺AI系統在大幅降低期望後已準備好部署 | Frank Landymore, Futurism
AI在法律領域的應用是一份持續的禮物。
這一次,是在為阿拉斯加法院系統建造AI聊天機器人的團隊實際測試後,感受到的令人失望的現實,NBC新聞報導。
這個名為阿拉斯加虛擬助手的聊天機器人,旨在幫助人們處理遺產相關的表格和其他程序,這是將一個人去世後的財物轉移的法律過程。
在一個可預測的事件中,這個AI並沒有簡化已經讓人頭痛的過程,這個過程對於那些可能正在哀悼失去摯愛的人來說,反而讓人感到煩惱,而不是得到支持。
根據參與開發的人士,這位受人尊敬的虛擬助手展現了所有大型語言模型固有的失敗,持續出現幻覺,或是編造事實並分享誇大的信息。
“我們在幻覺方面遇到了麻煩,無論模型如何,聊天機器人不應該實際使用其知識庫以外的任何東西,”全國州法院中心(NCSC)的顧問Aubrie Souza告訴NBC新聞。“例如,當我們問它,‘我在哪裡可以獲得法律幫助?’它會告訴你,‘阿拉斯加有一所法學院,所以看看校友網絡。’但阿拉斯加並沒有法學院。”
而且,大多數測試過的人並沒有覺得它有幫助,反而覺得它非常令人厭煩。這個機器人,毫不意外地,遭受著大多數聊天機器人所困擾的同樣性格缺陷:過於諂媚和甜膩,假裝同情,並用客套話來取悅你,而不是直接進入正題。
“通過我們的用戶測試,每個人都說,‘我厭倦了生活中每個人告訴我他們對我的損失感到抱歉,’”Souza說。“所以我們基本上去除了這類慰問,因為從AI聊天機器人那裡,你不需要再多一個。”
這個AI是與一位名叫Tom Martin的律師合作建造的,他經營著一家名為LawDroid的公司,該公司製作AI法律工具,AVA AI在開發地獄中已經困了超過一年,根據Souza的說法,這本應是一個三個月的項目。在降低期望並確保修正其可怕的缺陷後,AVA的團隊表示,它終於準備好在一月下旬進行公開發布。
“我們在這個項目上確實稍微調整了目標,”阿拉斯加法院系統的行政主任及AVA項目負責人Stacey Marz告訴NBC新聞。“我們希望複製我們自助中心的人類協助者能夠與人分享的內容。但我們不確定這些機器人能否以那種方式運作,因為存在一些不準確和不完整的問題。”
“這實在是非常勞動密集的工作,”Marz補充道,儘管“關於生成AI的所有熱議,以及每個人都說這將徹底改變自助並民主化法院的訪問。”

熱門
排行
收藏
