美女粉嫩极品国产在线2020,亚洲国产中文欧美国产综合在线,一本一道中文字幕无码东京热,国农村精品国产自线拍

首頁>要聞 要聞

美研究員開發新算法打擊學術造假 用AI查重論文圖片

2019年01月16日 09:57 | 來源:中國青年報
分享到: 

有圖無真相

在打擊學術造假的征途上,學術規范機構又下一城。

點擊進入下一頁

資料圖:人工智能機器人。

來自美國紐約雪城大學(Syracuse University)的機器學習研究員丹尼爾?阿庫納(Daniel Acuna)等在2018年開發出一套算法,能利用人工智能(AI)識別學術論文中的圖像造假,對論文圖片進行查重。

他們分析了生命科學領域來自4324本期刊的76萬篇開放獲取(Open Access)論文,并從中提出有效的263萬張圖片。其中,約有9%的圖像存在高度重復。該團隊又在其中選取了約4000張可疑圖片進行人工核查。經測算,在所有論文中,約1.5%存在學術不端的嫌疑,0.6%確認存在圖像方面的論文造假。

在學術造假上,圖片是藏污納垢的死角。《科學》(Science)雜志和《撤稿觀察》(Retraction Watch)2018年發布報告稱,在過去10年里,學術期刊撤回的論文數量增加了10倍。這些論文中,約有1.7%是因為篡改了論文圖像被撤回。

美國賓夕法尼亞大學生物工程副教授阿榮?拉杰(Arjun Raj)早在2012年就指出,一篇生命科學領域的研究論文背后的科學成本約為30萬-50萬美元。2012年全年,美國研究人員共發表該領域論文15.2萬篇。如果其中1.7%因圖片造假需要被撤回,則僅在2012年,因此造成的損失就接近10億美元。

根據出版機構的統計,全球科學產量每9年就會翻番。

過去,圖片審核工作往往要靠人力完成,幾乎沒有自動化的流程。《自然》(Nature)雜志會對收到的稿件隨機抽樣進行檢查,并要求作者提供未編輯的圖像作參考;生命科學領域的重要刊物《細胞生物學雜志》(Journal of Cell Biology)和《歐洲分子生物學組織雜志》(The EMBO Journal)會對圖片進行手動查重。

2018年6月,來自斯坦福大學的微生物學家分析了2009-2016年發表在《分子與細胞生物學》(Molecular and Cellular Biology)上的960篇論文,發現其中59篇含有“不適當的”重復圖像,約有2%值得再去進行圖像證偽。他們將情況反映給出版機構后,42篇論文更正了圖片,5篇被撤稿。

圖片查重費時費力,以至于多數刊物都沒有這項流程。《歐洲分子生物學組織雜志》主編表示,人工篩選非常耗時,早就應該有一個常規的、自動化的工具簡化這一過程。

美國誠信研究辦公室(the United States Office of Research Integrity, 簡稱ORI)的數據顯示,圖片造假的情況一直在惡化,標志性的兩個時間是1990年和1996年,Photoshop的Mac版和PC版在這兩年發布。

但即使是ORI,每年也僅報告了10例圖片造假的行為。因為成本過高,他們不會主動審查學術不端,僅在有舉報的情況下進行。

自誕生起,學術論文就承擔著描述科研成果、進行學術交流的重任。它還被用來衡量學者的學術水平,是評定職稱、獲取科研經費等環節中考察的重要的內容。因此,判斷一篇學術論文是否由抄襲、造假得來至關重要。

在計算機技術不夠發達、數據庫尚未開放共享的時代,識別學術不端不得不依靠評審編輯慧眼如炬。在中國,論文文字查重體系一直到2005年前后才建立。后來,人們又不斷優化這個系統,從能識別“復制粘貼型”抄襲,到能識別改變用詞和句法的抄襲,但圖片重復一直是論文查重的死角。

道高一尺,魔高一丈,心懷不軌的研究人員已經學會了應付能識別文字抄襲的系統。在生命科學等依賴圖像實物的研究領域,圖片造假的難度和成本會更高。

2014年轟動學術圈的小保方晴子學術造假丑聞中,她的團隊被發現使用了小保方晴子博士學位論文中的圖片,用來證明新的發現。更多時候,造假來得更隱秘,研究人員用旋轉、裁剪、調整大小和對比度的方式調整圖片。它們常常難以被察覺,直到前赴后繼的科研人員發現研究成果無法復現。此時,大量的人力和資金成本都被浪費了。

如何解決這個問題,仍然是擺在我們面前的一座大山。即使是丹尼爾?阿庫納等人開發出的算法,也面臨很大的困難。在每一個領域,我們需要專業人士進行足夠數量的前期人工標注。

這套算法的運算速度也有限,目前只能考察作者自己發表的諸多論文中是否存在重復,尚無法應對以億為單位的出版文獻庫。出版巨頭愛思唯爾(Elsevier)誠信部門主管也表示,出版商需要創建一個共享的數據庫,以便進行相關檢索,查實論文圖片重復使用的情況。

我們似乎無法阻止“魔”的存在,只能努力讓“道”高得快一點(王嘉興)。

編輯:曾珂

關鍵詞:美研究員開發新算法打擊學術造假 用AI查重論文圖片

更多

更多