讓計算機、智能手機這樣的機器像人一樣來理解和使用語言,這是語言信息處理專家們的夢想。然而,相較于英文而言,中文表達缺少詞與詞之間的空格,人名首字母大寫這類明顯的表層語法特征,使得機器識別和表達中文信息時困難更多。12月23日至24日,中文信息學會在京舉行第八次全國會員代表大會暨學會成立35周年學術會議,專家們解讀了讓機器“說”中文的研究進展。 讓中國人與機器自由交流 中國中文信息學會理事長、哈爾濱工業大學教授李生說:“中文信息處理就包含對中文(漢語,少數民族語言)的編碼、音、形、義等方面的計算機自動處理。” 實際上,在計算機問世并迅速引發席卷全球的信息技術革命時,由于其使用英文語言,如何進行漢字編碼、存儲、輸入和輸出一度成為計算機在中國普及和推廣的“攔路虎”。此后,在速記專家唐亞偉發明亞偉中文速錄機,北京大學王選院士等人研究出漢字照排和印刷技術研究,并解決了巨量漢字字形信息存儲和輸出等問題之后,電腦才與漢字“兼容”。 如今,隨著IBM的沃森超級計算機、谷歌的阿爾法圍棋、百度的小度機器人、微軟小冰,以及蘋果的Siri等人機交互系統走進人們的日常生活,能與人類用“語言”交流的應用已經無處不在,且更加智能,而這些現代科技催生的智能“機器”在中國的推廣應用,始終存在將英文語言轉化為中文形式的需求。對此,與會專家們表示,中文語言處理的目標就是讓機器像人一樣來理解和生成中文,讓中國人可以用自己的語言與機器進行自由交流。 機器“說”中文需獨立發展理論 讓智能機器“說”中文,最大的難點是什么?李生說:“中文處理與英文有諸多差異,但是其最核心的區別在于中文重義合,英文重形合。”這使得中文表達相比英文缺少明顯的表層語法特征,例如詞與詞之間的空格,人名等單詞的首字母大寫等,這種差異導致機器處理許多語法層面的任務時,中文比英文要更困難一些。 “中英文之間的差異甚至已經體現在人腦對語言信息的處理上,而這已經得到了神經科學的證實。”李生說,這一點美國科學院院刊曾刊發論文進行論述,“中文信息處理領域內的很多資深科學家也強調需要正視中英文差異,獨立發展中文的處理理論。” “要最終達到機器理解中文的目的,還有很多尚未解決的難題。”中國科學院自動化所研究院宗成慶說,中文信息處理是多學科交叉的復雜問題,僅歧義消解這一難題就已經讓自然語言處理研究者左支右絀,力不從心。 “更何況人類運用語言還有多種多樣的表現手法,諸如隱喻、幽默、夸張、雙關、影射等,它們對自然語言理解研究都有深刻的影響。”而目前對有些問題剛開始研究,有些甚至尚未觸及。對此,宗成慶認為,要實現機器對語言的理解,必須首先解開人類理解語言機制的秘密,這是有關人類認知機理、智能本質的科學難題。 中文信息處理讓人們更“聰明” 能夠進行各種語言互譯的計算機軟件是人們如今常用的語言處理工具。但經過多年的發展,機器翻譯仍然不能讓人十分滿意。在該學術會議上發布的2016年《中文信息處理發展報告》中指出,在“信、達、雅”這三個語言翻譯的不同層次上,目前的機器翻譯還基本掙扎在“信”的階段。未來,機器翻譯質量的提高還有賴于基于神經網絡技術的翻譯方法等的發展進步。 對此,李生表示,以互聯網、大數據和深度學習為標志的海量信息時代的到來,也給信息檢索、語音技術、文字識別、自動問答、機器翻譯等中文信息處理領域帶來了新的挑戰和機遇。 他舉例說,人工智能技術給中文信息處理帶來了諸如手機語音助手等許多新應用場景,這其中又產生了大量的用戶反饋數據,這些海量的數據則促進了基于中文的知識圖譜建立和深度學習等新技術的應用和發展。李生認為,這些變革會極大地將人們從中文記錄、翻譯、文字識別等機械勞動中解放出來,同時也會提升人們的認知能力。他說:“總之,借助中文信息處理技術的諸多進步,我們會了解得更多,變得更‘聰明’。” 《光明日報》( 2016年12月25日 01版) |
相關閱讀:
- [ 11-30]“做好大機器中的一顆螺絲釘”
- [ 11-10]石獅初一男孩體育課玩雙杠 摔下重傷靠機器維持
- [ 11-09]農林大學子喜獲第十三屆國際遺傳工程機器設計大賽(IGEM)金牌
- [ 11-08]《機器之血》辦奧斯卡餞行派對 成龍感動差點流淚
![]() |
![]() |
![]() |
打印 | 收藏 | 發給好友 【字號 大 中 小】 |
信息網絡傳播視聽節目許可(互聯網視聽節目服務/移動互聯網視聽節目服務)證號:1310572 廣播電視節目制作經營許可證(閩)字第085號
網絡出版服務許可證 (署)網出證(閩)字第018號 增值電信業務經營許可證 閩B2-20100029 互聯網藥品信息服務(閩)-經營性-2015-0001
福建日報報業集團擁有東南網采編人員所創作作品之版權,未經報業集團書面授權,不得轉載、摘編或以其他方式使用和傳播
職業道德監督、違法和不良信息舉報電話:0591-87095403(工作日9:00-12:00、15:00-18:00) 舉報郵箱:jubao@fjsen.com 福建省新聞道德委舉報電話:0591-87275327