寫稿機器人“小南”是“智媒體實驗室”推出的首個研究應用成果。“智媒體實驗室”由南方都市報社、凱迪網絡和北京大學計算機科學技術研究所聯合成立,欲在推動媒體智能化技術研發、促進自然語言處理等科學領域的發展、探索媒體智能化產品服務的新運營模式等方面開展深度合作。 里約奧運會讓“張小明”名噪一時,這部寫稿機器人6天寫出400多篇稿件,它與擊退全部國外照排系統的“方正電子出版系統”師出同門,均誕生于北京大學計算機科學技術研究所(以下簡稱北大計算機所)。 這個被認為可以“讓記者下崗”,引領媒體行業進入全新時代的“新聞機器人”此后分身有術,在體育、財經、春運甚至時政類新聞報道中屢現“身影”—— 2017年春運,北大計算機所和南方都市報社合作的“小南”,在一票難求時通過與12306打通技術連接,秒級播報廣州旅客和列車情況;2017年兩會,它又化身“阿同”,最快速度解讀幾十萬字的兩會六大報告,最快“敲黑板”“劃重點”。 “過去35年,我們始終傳承王選精神,發展王選事業。”5月28日,在接受科技日報記者專訪時,北大計算機所所長郭宗明介紹,“頂天立地”是計算機所一直秉持的王選精神之一,“頂天指的是最先進的科學技術,立地就是大范圍科技成果的應用。研究要面向應用,哪怕是短期沒有應用前景,長期有應用前景的,我們也堅持研究。” 研究的步子要走在需求前面 “黑白的排版印刷系統,用戶都是排著隊來買的。”郭宗明回憶,1989年,激光照排系統獲得成功,新華社報道“我國印刷技術將開創新紀元”。 面對“黑白排版”紅得發紫的市場,當彩色出版系統關鍵技術的研發課題提出時,企業側很多人是反對的。“一方面,研發部門和市場部門的同事已經疲于應付超飽和的市場需求,另一方面,高企的業績讓人甘于滿足。”郭宗明回憶,“但是,王選老師頂住壓力,堅持要搞彩色出版。” 1992年6月1日,《科技日報》在中國大陸首家采用方正彩色出版系統出版彩報。隨后高檔彩色出版系統這一科研成果迅速進入東南亞和北美,占領了海外80%的華文報業市場。 研究是對未知的探索,是永遠不滿足于已經獲得和已經達成。新時代的王選“接班人”們同樣走在市場需求之前,力求讓科研成果符合要求,順利落地。 “以前文本信息是網絡信息中的主流類型。”北大計算機所多媒體信息處理研究室主任彭宇新教授說,近幾年圖像、視頻等多媒體數據鋪天蓋地而來,已經占據大數據的80%以上。 然而對于圖像、視頻數據類型的分析技術,北大計算機研究所早在2005年前后就已經開始布局。 研發要基于市場需求,卻不是被市場牽著鼻子走,郭宗明認為,對研究發現的把握要有前瞻性,是要牽著市場的鼻子走。在研發階段就要對以后的應用市場心里有數,讓科研成果轉化的工作走在前面。 “隨著硬件的發展,數據類型就會發生巨大變化,智能識別的任務將發生變化。”彭宇新就是這樣“看三步”地確定了團隊的研究方向——為人工智能的數據庫中加上圖像、視頻。 團隊創新性地發明了基于注意力模型和深度增量學習的識別方法,并6次參加國際權威評測TRECVID的視頻樣例搜索比賽均獲第一名,在與卡內基梅隆大學、牛津大學、IBM Watson研究中心等參賽隊伍的較量中勝出。 技術的“抽絲剝繭”,讓圖像、視頻中的信息如文本一般精確透明。“我們是瞄著應用去的,準確率、處理速度都經過多年優化,并已落地應用。”彭宇新介紹,這項技術不僅幫助新聞媒體等行業進行數據管理和檢索,還在助力互聯網管理部門對大數據進行分析與監測。 聯手企業重新定義媒體 2017年春節的假期還沒走遠,廣州日報的緊急任務就找上了門。 “希望讓寫稿機器人進行全國兩會的報道,這是首次嘗試敏感的時政話題,”北大方正電子有限公司新媒體產品事業部總經理霍為兵回憶,當時,廣州日報領導帶領團隊親自上門商討合作。 這次的挑戰是雙重的:一方面時政話題“容錯率”幾乎為零,這對技術是一個很高的挑戰;另一方面,從需求提出到兩會召開,只有不到一個月的時間。 “我們還是決定接受挑戰。”霍為兵回憶,北大計算所研究員萬小軍團隊緊急“應戰”,并和方正電子研發團隊快速對接。“當時已經不是海量算法的訓練階段,而是有針對性地對機器人進行訓練,包括對歷史數據的文案進行分析、形成適合時政的文風,最后確定了綜述和簡訊兩類寫作類型。”霍為兵說,“機器人跑兩會”在各方的共同努力和把關下,在兩會期間快速寫出了十幾篇分析文章。“這次實踐引起了轟動。” 霍為兵表示,越來越多研究成果轉化為實際應用的成功案例,幫助方正電子打開了新媒體市場的大門。新聞機器人不再局限于寫稿,它出現了更多的應用場景,“媒體”也跟著被重新定義。此外用機器人進行新聞創作線索的發現、實現新聞的精準分發都在逐步投入應用。 成長為教學研用的“全優生” “發論文一度是我們不擅長的。”作為研究所的帶頭人,郭宗明曾有過與其他研究所領導不同的苦惱——別人苦于成果轉化不出去,而他苦于好成果寫不出對應的好論文。 1995年,為了方正電子在港股上市,北大計算機所劃入方正集團,傾盡所有科研實力為企業服務,當時約定10年為期。 “10年期滿,我們覺得還是選擇獨立的研究之路。”郭宗明回憶,不惟市場的研究能恢復研究“天馬行空”的自由,找回自我,也能產出更多前瞻性的科研成果。 從服務別人的“B角”轉變為自主科研的“A角”,從企業走出來的研究員們一時間還跳不出“唯用至上”的思路,并不熱衷于寫論文。“但是學校會考核我們,標準變了。”郭宗明說,為了推動科研人員在思想上轉變,當時所里還出臺了論文獎勵辦法,鼓勵科研人員發表論文。 當全國都在討論“科技成果轉化率低”“只發論文沒有轉化”等科技經濟兩張皮的問題時,北大計算機所卻正好相反。“好的論文意味著你要有好的成果,好的研究內容,更要有好的寫作能力。”郭宗明說,“進入企業的十多年,讓我們和學校老師在學術論文的表達上有很大的差距。” 失之東隅,收之桑榆。北大計算機所的人均專利是北京大學這所高等學府專利持有量的5倍之多。2017年,北大計算機所與方正電子簽約合同額超過900萬元,是前幾年的數倍,郭宗明認為,經過幾年的刻苦努力,北大計算機所從一個科研能力特別強的“特長生”,成長為教學、科研、產業應用等全面優秀的“全優生”,并開始批量產出研究成果。 不只與方正集團,在科技成果轉化方面,阿里、優酷、央視、國家部委等都是北大計算機所成果落地的合作伙伴。 “我們對市場摸得太熟了。”郭宗明此前也在方正集團擔任過技術總監的職務,有了十年來錘煉的市場基因,加上探索研究的情懷,對于新時代的王選接班人來說,“頂天立地”間,有更廣闊的施展空間。 “隨著新成果轉化法的落地實施,我們在期待細則的進一步落地,相信未來將有更多的能夠產生技術變革和產業顛覆的創新落地。”郭宗明說。 下一篇4 |
相關閱讀:
- [ 05-31]北大“白求恩”:見證中國25年發展歷程 愿為城鎮化做貢獻
- [ 05-05]校慶演講讀錯“鴻鵠”發音,北大校長林建華發道歉信
- [ 05-03]15句話感受習近平在北大對青年和教育的殷切希望
- [ 05-03]再到北大,習近平這些話語重心長
- [ 05-03]扎根人民、奉獻國家——習近平總書記的考察在北大師生中引起熱烈反響
![]() |
![]() |
打印 | 收藏 | 發給好友 【字號 大 中 小】 |
信息網絡傳播視聽節目許可(互聯網視聽節目服務/移動互聯網視聽節目服務)證號:1310572 廣播電視節目制作經營許可證(閩)字第085號
網絡出版服務許可證 (署)網出證(閩)字第018號 增值電信業務經營許可證 閩B2-20100029 互聯網藥品信息服務(閩)-經營性-2015-0001
福建日報報業集團擁有東南網采編人員所創作作品之版權,未經報業集團書面授權,不得轉載、摘編或以其他方式使用和傳播
職業道德監督、違法和不良信息舉報電話:0591-87095403(工作日9:00-12:00、15:00-18:00) 舉報郵箱:jubao@fjsen.com 福建省新聞道德委舉報電話:0591-87275327