成果信息
系統(tǒng)采用目前國際上流行的統(tǒng)計機器翻譯方法,集機器學(xué)習(xí)、網(wǎng)絡(luò)文本挖掘和自然語言理解等技術(shù)之優(yōu)勢于一體,具有人機交互功能,實現(xiàn)下列不同語言之間的自動翻譯:漢英雙向、日漢、德漢、維吾爾語到漢語和藏語到漢語。目前翻譯領(lǐng)域為新聞通用領(lǐng)域和日??谡Z會話領(lǐng)域。新聞領(lǐng)域的漢英雙向翻譯的正確率可達(dá)75%以上,口語領(lǐng)域的正確率可達(dá)85%以上。新聞領(lǐng)域日漢、德漢、維漢和藏漢翻譯的正確率可以70%以上。全文翻譯的速度為每秒100個字(詞)以上。如果用戶提供相關(guān)領(lǐng)域大量已有的雙語句對,本系統(tǒng)可以在短時間內(nèi)適應(yīng)特定領(lǐng)域的翻譯要求。人機交互功能可以使系統(tǒng)在使用中通過用戶操作獲取用戶翻譯偏向,逐步提高翻譯系統(tǒng)的性能。)
背景介紹
信息的空前規(guī)模的爆炸性增長和多語種、多應(yīng)用平臺特點,對信息處理的實時性、準(zhǔn)確性、針對性、有效性都提出了更高的要求。另一方面,不同語言之間理解交流的障礙和信息的低利用率逐漸成為信息化發(fā)展的關(guān)鍵制約因素,以多語種機器翻譯技術(shù)為核心的多語信息處理已成為國際社會激烈競爭的高科技研究領(lǐng)域,歐美、日本等國的研究機構(gòu)和IBM、微軟等業(yè)界巨頭均開展多語種網(wǎng)絡(luò)信息處理相關(guān)的研究開發(fā)工作。因此,如何實現(xiàn)對繁雜多元的信息的有效管理和利用,實現(xiàn)對信息的智能化翻譯處理,以提高全社會信息應(yīng)用的能力和水平、帶動相關(guān)產(chǎn)業(yè)發(fā)展、促進國際交流與合作、推動社會信息化進程和人類文明進步,是計算機應(yīng)用研究領(lǐng)域的一項艱巨任務(wù),具有重大的科學(xué)研究意義和廣闊的應(yīng)用前景。)
應(yīng)用前景
本系統(tǒng)可廣泛應(yīng)用于信息獲取、情報分析和各類文本的自動翻譯等方面,尤其是特定領(lǐng)域技術(shù)文檔的自動翻譯和外文資料的快速瀏覽。目前已得到實際應(yīng)用。)