圖片來源:princeea網(wǎng)站
如果AI系統(tǒng)作出了正確預測,但卻以完全不同的方式解釋其得出的這些結果,會發(fā)生什么?DFKI數(shù)據(jù)科學團隊介紹了“X-hacking”給AI可信度帶來結構性風險的研究成果。
X-hacking一詞源于統(tǒng)計學中的P-hacking。所謂P-hacking指的是研究人員可通過一些數(shù)據(jù)操作技巧,在統(tǒng)計學上得出一個有顯著意義的結果,即使這個結果實際上并無意義。這相當于一種數(shù)據(jù)篡改,可能會導致發(fā)布假陽性結果。
相應的X-hacking描述了兩種核心機制:一是Cherry-picking,即從眾多同樣優(yōu)秀的模型中,精心挑選出解釋能力最強、最能支持預期結果的模型;二是定向搜索,AutoML系統(tǒng)不僅能優(yōu)化預測性能,還能精準地找到具有特定解釋模式的模型。但這里面存在的風險往往被低估。
即使模型得出的結果幾乎相同,所謂的特征重要性也可能存在巨大差異。這在醫(yī)學研究或社會科學等應用領域尤為敏感,因為在這些領域,可解釋的模型通常構成關鍵決策的基礎。
AutoML代表了開發(fā)、選擇和優(yōu)化機器學習模型的自動化流程。軟件工具接管了許多以前只有經(jīng)驗豐富的機器學習工程師才能完成的任務,例如選擇合適的模型架構、數(shù)據(jù)預處理和超參數(shù)優(yōu)化等。在醫(yī)學、工業(yè)或社會研究等數(shù)據(jù)密集型領域,AutoML有望實現(xiàn)更快的開發(fā)速度、更低的進入門檻和可重復的結果。
然而,這種自動化使得人們難以理解模型決策的制定方式,這是可解釋AI的一個關鍵問題。因此,DFKI研究團隊建議,使用AutoML的學科應該意識到方法的風險,而不僅僅只是信任軟件。
關鍵詞:
凡注有"環(huán)球傳媒網(wǎng)"或電頭為"環(huán)球傳媒網(wǎng)"的稿件,均為環(huán)球傳媒網(wǎng)獨家版權所有,未經(jīng)許可不得轉載或鏡像;授權轉載必須注明來源為"環(huán)球傳媒網(wǎng)",并保留"環(huán)球傳媒網(wǎng)"的電頭。
- 北京防汛一級應急響應 遇極端情況地鐵將立即封站區(qū)段停運 新消息
- 人民日報刊文評陳佩斯喜劇藝術:一位喜劇人的藝術探索和理論自覺 每日快看
- 探訪全球最大塔機工廠,中聯(lián)重科:海外市場成新增長引擎,占比六成|最新消息
- 國家發(fā)展改革委緊急安排5000萬元支持河北暴雨洪澇災害災后應急恢復
- “十四五”以來稅務部門共查處違法納稅人6.21萬戶,挽回各類稅款損失5710億
- 6月中國規(guī)上工業(yè)企業(yè)利潤同比降幅收窄 每日資訊
- 微動態(tài)丨水淋淋的是什么意思?水淋淋的是什么梗?
- 《海南歷史文化名人叢書》全系列100種面世首發(fā) 焦點要聞
- 世運會探館Vlog:“順勢”建成的水上項目場地
- 每日熱訊!三伏天來了,這些養(yǎng)生誤區(qū)要避免
資訊
- 微頭條丨校園配餐服務新國標出臺 提高管理門檻筑牢安全底線
- 北京平谷區(qū)啟動防汛一級應急響應|實時
- 世名科技:董事長陸勇被實施留置,為其個人事務、與公司無關-通訊
- 有一種“詩和遠方”在延吉——寫在第五屆全國新電商大會召開之際
- “羅莎”加強為臺風級 未來對我國海域無影響 速看料
- 速遞!四川古藺縣發(fā)生一起邊坡垮塌致3人遇難
- 十年后《你行!你上!》豆瓣還會是6.7分嗎-每日熱文
- 紀錄電影《山河為證》首發(fā)“致敬偉大勝利”預告 以世界視角銘刻中國抗戰(zhàn)
- 微動態(tài)丨新華能源周報丨國家能源局發(fā)布最新全國電力工業(yè)統(tǒng)計數(shù)據(jù);多家能源央企高層調整
- 國門高鐵站憑祥東站站房建設完成 預計今年內具備通車條件 今日看點
焦點
- 入股不虧是什么意思?入股不虧是什么梗?
- 浙江長興:外賣騎手組隊為高齡老人免費送餐到家
- 播報:稅務總局:從今年個稅匯算看,超1億納稅人依法申請退稅1300多億,700多萬納稅人申報補稅480余億
- 即時:事關3800萬貨車司機!交通運輸部部署保障司機合理勞動報酬
- 熱議:“竹夢”抵達成都熊貓基地 成龍攜火炬登頂“筍子塔”
- 全國東西南北中羽毛球大賽雞西大區(qū)賽開賽 頭條焦點
- 甘肅魏晉畫像磚特展長沙開幕 “磚”看古人生活日常|熱點
- 你已超過99%的人!助力世運火炬?zhèn)鬟f沒你不行
- 新華社權威速覽·非凡“十四五”|減輕看病就醫(yī)負擔,醫(yī)保支付這樣發(fā)力!-每日熱議
- 拼盤動畫片如何擺脫“番劇感”? 從《聊齋:蘭若寺》的6段故事說起