台灣FANS俱樂部

台灣FANS俱樂部 網站首頁 探索 查看內容

IBM發表DLPaper2Code:從深度學習論文自動生成Keras或Caffe代碼

IBM發表DLPaper2Code:從深度學習論文自動生成Keras或Caffe代碼



圖:pexels



原文來源:arXiv



作者:Anush Sankaran, Naveen Panwar, Shreya Khare, Senthil Mani



「雷克世界」編譯:嗯~阿童木呀



現如今,隨著深度學習領域大量研究論文的湧現,現有研究的重現性或采用逐漸成為一個挑戰。而造成這一現象的主要原因是作者所提供的開放源碼缺乏實現。此外,在不同的庫中重新實現研究論文也是一項異常艱巨的任務。為了解決這些挑戰,我們提出了一種全新的可擴展方法——DLPaper2Code,用於提取和理解研究論文中提供的深度學習設計流程圖和表格,並將其轉換為抽象的計算圖,隨後提取的計算圖被實時地轉換為執行就緒的實時Keras和Caffe源碼。就這樣,一個類似arXiv的網站被創建出來了,其中為5000篇研究論文提供自動生成的設計得以實現。生成的設計可以使用直觀的拖放(drag-and-drop)UI框架以眾包的方式對其進行評論和編輯。為了對我們的方法進行評估,我們使用手動定義的語法創建了一個具有超過216000個有效設計可視化的模擬數據集。在模擬數據集上進行的實驗結果表明,所提出的框架在流程圖內容提取上的準確率達到93%以上。



IBM發表DLPaper2Code:從深度學習論文自動生成Keras或Caffe代碼



在過去的十年裡,人工智能領域中的深度學習(DL)以驚人的速度迅速發展,其中,自2016年以來大約有35800篇相關研究論文得以發表。對於越來越多的研究人員和實踐者來說,與日益增長的文學發展齊驅並進,逐漸成為一場真正的戰爭。在最近的一次AI會議——NIPS 2016上,有關主題“深度學習或神經網絡”所提交的論文數最多(約685/2500)。但是,這些研究論文中的大多數並沒有伴隨相應的實現。在NIPS 2016中,只有101/567份(約18%)論文中的源碼資源得以實現。對軟件工程師來說,假設他們在深度學習領域的認知有限,那麼至少需要花費幾天時間才能將研究論文得以實現。



而另一個主要挑戰是以多種編程語言實現DL算法的各種庫的可用性,比如Tensorflow(Abadi等人於2016年提出)、Theano(Bastien等人於2012年提出)、Caffe(Jia等人於2014年提出)、Torch(於2011年提出)、MXNet(Chen於2015年提出)、DL4J(Gibson 於2015年提出)、CNTK(Seide和Agarwal 於2016年提出),以及諸如Keras(Chollet等人於2015年提出)、Lasagne(Dieleman 於2015年提出)和PyTorch(Chintala 於2016年提出)等封裝的可用性。深度學習研究論文的公開實現可以在各種庫中得以使用,且它們之間幾乎沒有互操作性或通信能力。考慮一個研究人員在“圖像註釋”研究中的用例,其中被高度引用的關於圖像註釋這個問題的三篇研究論文分別是:



1.《Show and Tell 》(Vinallys等人於2015年提出):能夠用Theano執行的原始實現;



https://github.com/kelvinxu/arctic-captions



2. 《NeuralTalk2》(Karpathy和Fei-Fei 於2015年提出):能夠用Torch執行的原始實現;



https://github.com/karpathy/neuraltalk2



3. 《LRCN》(Donahue等人於2015年提出):能夠用Caffe執行的原始實現;



http://jeffdonahue.com/lrcn/



IBM發表DLPaper2Code:從深度學習論文自動生成Keras或Caffe代碼



擬議的創意系統的體系結構,從深度學習研究論文中提取和理解流程圖,並在兩種不同的平臺上: Keras和Caffe,生成一種執行深度學習代碼



由於這些實現能夠用各種不同的庫中得以執行,因此研究人員不能直接將模型組合在一起,而且,對於仍然停留在使用Java代碼庫(DL4J)的從業者來說,直接利用這些公共實現中的任何一個都是非常艱巨的。因此,在這裡我們著重強調深度學習中兩個被忽視的挑戰:



1.缺乏一個可供現有研究運行的公共實現,因此在重現其結果時會需要時間。



2.現有的實現僅限於一個(或少數)庫,從而限制了移植到其他流行的深度學習庫的可能性。



我們觀察到,大部分的研究論文都是通過圖形或者表格來解釋深度學習模型設計的。因此,在這項研究中,我們提出了一種全新的算法,該算法能夠自動解析一篇研究論文從而提取文中所描述的深度學習模型設計。該設計可被表示為獨立於實現庫或語言的抽象計算圖。最後,可以從深度學習設計的抽象計算圖中生成多個庫中的源代碼。結果顯示,在Caffe(prototxt)和Keras(python)中自動生成5000篇arXiv論文的源代碼。但是,由於缺乏對比標準,對生成的源代碼所進行的評估還是具有一定難度的。為了克服這個挑戰,我們在Caffe和Keras中模擬了一個有216000個有效DL模型設計的大型圖像數據集。為了生成深度學習可視化,我們手動定義了深度學習模型的語法。由於這些可視化技術的高度變化,它們可與研究論文中所展示的圖形相媲美。因此,主要的研究貢獻是:



1.一種分析研究論文中的圖形和表格來自動理解深度學習模型設計的技術,



2. 從一個深度學習設計的抽象計算圖中Keras和Caffe中的源代碼,



3.自動生成5000篇arXiv論文中所描述的設計,並構建一個UI系統,以眾包的方式進行編輯,



4.使用手動定義的語法在216000個深度學習模型可視化的模擬數據集上評估所提出的方法以實現超過95%的準確度。



可以這樣說,從此研究人員和開發人員不必再為重現深度學習領域的研究論文而苦苦掙扎。利用這一研究,就可以自動提取在研究論文中所描述的深度學習設計。使用一個直觀的基於拖放的UI編輯器(我們設計將其作為這個研究的一部分),就可以對所提取的設計進行手動編輯和完善。此外,對於所提取的深度學習設計,源代碼可以在Keras(Python)和Caffe(prototxt)中得以實時生成。所提出的DLpaper2Code框架能夠從研究論文中提取圖形和表格信息並將其轉換為源代碼。目前,創建了一個類似arXiv的網站,其中包含5000篇研究論文的DL設計和源代碼。為了評估我們的方法,我們模擬了一組包含108000個獨特的深度學習設計的數據集,這些設計通過一個提出的語法和相應的Keras和Caffe可視化進行驗證。在一個包含216000個深度學習模型可視化圖表和28120個出現在深度學習論文中但不含有模型可視化圖表的數據集中,所提出的使用NNet分類器的二進制分類法獲得了99.9%的準確率。使用提出的管道提取計算圖形圖表的性能提高了93%以上。雖然這項研究可能會對深度學習研究的再現性產生很大的影響,但我們已經計劃了大量可能的擴展計劃:



1.所提出的這個管道只能檢測到圖中的層(斑點)和邊緣,它可以擴展到檢測和提取每個層的超參數值,從而使計算圖具有更豐富的內容。



2.目前,我們有兩個獨立的管道,用於從表格和圖形中生成抽象的計算圖,結合從多模源獲得的信息可以提高提取的深度學習設計流的準確性。



3.除了Keras和Caffe之外,整個DLPaper2Code框架還可以擴展為支持附加的庫,比如Torch、Tensorflow等。



4.更廣泛的目標是提出一個能夠在研究論文中表示深度學習模型設計的定義,從而實現統一性和更好的可讀性。此外,未來論文的作者還可以在創建的網站上發布他們的設計,以便於社區的訪問。



論文下載鏈接:https://arxiv.org/pdf/1711.03543.pdf



Copyright © 2008 - 2017 TaiwanFansclub All rights reserved.
返回頂部