无码日韩精品一区二区免费_极品尤物一区二区三区_国产在线乱码一区二三区_内射女校花一区二区三区

人工智能延伸科學(xué)交流觸角

發(fā)布:ka2012 2019-08-26 15:46 閱讀:2221
近日,一款看起來挺有文化的寫稿機(jī)器人上線了。它叫小柯,由中國科學(xué)報(bào)社和北京大學(xué)科研團(tuán)隊(duì)共同研發(fā)。 }\ hz@G<  
_|s'0F/t  
小柯寫的不是普通的稿子,而是中文科學(xué)新聞。據(jù)介紹,運(yùn)用自然語言處理技術(shù),小柯以英文論文摘要為基礎(chǔ),能夠快速寫出中文科學(xué)新聞底稿,然后由專業(yè)人士和報(bào)社的編輯進(jìn)行把關(guān)和信息完善,幫助科學(xué)家以中文方式快速獲取全球高水平英文論文中的最新科研進(jìn)展。 ZRj&k9D^U  
E6s)J -a  
目前小柯的作品已經(jīng)上線。人工智能的觸角,也在伸向各個(gè)領(lǐng)域。 5HW'nhE  
G q2@37U  
小柯:一個(gè)盡職的摘要翻譯轉(zhuǎn)寫者 7uxUqM  
\CZD.2p#&  
記者發(fā)現(xiàn),7月5日,小柯機(jī)器人發(fā)出第一篇稿子,截至8月22日記者統(tǒng)計(jì)時(shí),小柯機(jī)器人共發(fā)稿415篇。初期更新時(shí)間距論文發(fā)表時(shí)間間隔一個(gè)月左右,現(xiàn)在可以做到當(dāng)天或隔天更新,每天更新幾篇到二十幾篇不等。所選論文來自生命科學(xué)等領(lǐng)域,涉及《自然》《細(xì)胞》《新英格蘭醫(yī)學(xué)雜志》等期刊。 50NLguE  
d\j[O9W>  
記者對照分析了小柯作品《單細(xì)胞測序揭示冠狀動脈疾病保護(hù)機(jī)制》及其英文原文。新聞中,小柯先對論文主題、研究單位以及發(fā)表期刊進(jìn)行簡單介紹,后接英文原文摘要的翻譯,大致反映原文內(nèi)容;翻譯時(shí)會對原文進(jìn)行適當(dāng)?shù)恼Z句簡化,同時(shí)在對專業(yè)詞語的翻譯上也使用了如“血管平滑肌細(xì)胞”“保護(hù)性纖維帽”等專業(yè)表述。 Zo T8  
2#xz,RM.  
不過,這也不全是小柯的功勞,因?yàn)楦寮l(fā)出前,還有人工審校這一步驟。北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)研究所研究員萬小軍團(tuán)隊(duì)負(fù)責(zé)小柯的系統(tǒng)總體設(shè)計(jì)與聯(lián)合技術(shù)攻關(guān)。他告訴科技日報(bào)記者,目前機(jī)器翻譯系統(tǒng)的性能很大程度上依賴于其所使用的訓(xùn)練數(shù)據(jù),即平行語料。目前的平行語料多為新聞?wù)Z料,因此訓(xùn)練得到的機(jī)器翻譯模型對于日常新聞的翻譯效果較好。但學(xué)術(shù)文獻(xiàn)(比如生物學(xué)術(shù)論文)與日常新聞在用詞造句等方面都有較大差別,機(jī)器翻譯系統(tǒng)對于學(xué)術(shù)文獻(xiàn)翻譯的效果并不理想。 ,?`Zrxe[  
H{VJ S Jc{  
這一次,他們通過融合領(lǐng)域知識進(jìn)行語句智能篩選,選擇適合大眾理解的語句,并基于語句簡化提升語句翻譯質(zhì)量。“英文學(xué)術(shù)論文摘要適合專業(yè)科研人員閱讀,但摘要中的語句并不都適合寫到科學(xué)新聞中面向大眾傳播,因此需要結(jié)合編輯提供的先驗(yàn)知識,采用計(jì)算機(jī)算法對語句進(jìn)行篩選,保留適合進(jìn)行大眾新聞傳播的語句。”萬小軍說。 ,*d<hBGbh  
^?-wov$  
自然語言處理技術(shù)不只能讓機(jī)器人寫稿 C=<PYkt,L  
{# Vp`ji  
研發(fā)小柯用了半年時(shí)間,萬小軍表示,和一般寫稿機(jī)器人相比,一個(gè)好的跨語言科技新聞寫稿機(jī)器人需要進(jìn)行兩次重要的信息轉(zhuǎn)換過程:一次是不同語言的轉(zhuǎn)換,將英文文本轉(zhuǎn)換為中文文本;另一次是語言風(fēng)格的轉(zhuǎn)換,將學(xué)術(shù)型文字表達(dá)轉(zhuǎn)換為大眾能夠接受的通俗文字表達(dá)。“這兩次轉(zhuǎn)換都具有較大的挑戰(zhàn)性,目前并沒有完全解決。后續(xù)還需要進(jìn)一步積累數(shù)據(jù),調(diào)整算法模型,才能取得更好的效果。”萬小軍說。 {6gY6X-R  
SuFGIb7E  
接下來,團(tuán)隊(duì)還將繼續(xù)優(yōu)化小柯,讓它寫出的科學(xué)新聞內(nèi)容更豐富,表達(dá)更生動。 ^#)]ICV  
3\0,>L9ET@  
當(dāng)然,翻譯撰寫科技新聞稿件,只是自然語言處理等人工智能技術(shù)在學(xué)術(shù)交流中所能大顯身手的領(lǐng)域之一。 >A ?,[p`<  
GVUZn//  
“基本上,只要人類交流和工作過程中涉及到語言和文字的地方,自然語言處理技術(shù)都有可能發(fā)揮作用。”萬小軍說,在科研論文寫作過程中,可以借助自然語言處理技術(shù)幫助推薦參考文獻(xiàn),并自動生成related work等章節(jié)的文字;業(yè)界也有基于自然語言處理技術(shù)自動編撰圖書的嘗試。“我個(gè)人也接觸到很多很有意思也很有挑戰(zhàn)的應(yīng)用需求,但可惜的是不少需求都無法基于目前的自然語言處理技術(shù)進(jìn)行實(shí)現(xiàn)。自然語言處理技術(shù)還需要進(jìn)一步地發(fā)展和突破,我相信在未來將有更多的用武之地。” /=S\v<z  
$Lt'xW`8  
中國知網(wǎng)常務(wù)副總經(jīng)理張宏偉長期關(guān)注自然語言處理,大數(shù)據(jù)和人工智能方面的應(yīng)用研究。他告訴科技日報(bào)記者,在數(shù)字出版和知識服務(wù)的全鏈條中,你都能看到人工智能和機(jī)器學(xué)習(xí)技術(shù)的身影。 3&KRG}5  
8 ;"HM5+  
人工智能可以對數(shù)字出版的選題策劃、協(xié)同撰稿、內(nèi)容編審進(jìn)行賦能。大數(shù)據(jù)標(biāo)注機(jī)器人則能對海量文獻(xiàn)信息資源進(jìn)行OCR文字識別,智能版面分析,知識元抽取,自動分類,自動標(biāo)引主題,自動生成摘要,自動翻譯,自動標(biāo)注引用和參考文獻(xiàn)。 4~J 诏安县| 诸城市| 诸城市| 西乡县| 瑞丽市| 锡林浩特市| 九寨沟县| 离岛区| 太保市| 华坪县| 墨玉县| 翁牛特旗| 葫芦岛市| 怀安县| 綦江县| 丰镇市| 望谟县| 建始县| 沧州市| 赣榆县| 阿克陶县| 辽阳市| 百色市| 宜兰县| 天柱县| 三原县| 云安县| 渑池县| 富阳市| 九台市| 新河县| 金平| 张家口市| 玛曲县| 卓尼县| 韩城市| 宣化县| 固安县| 福州市| 东兴市| 永靖县|