成果信息
該項(xiàng)目致力于Web信息的采集及處理工作,基于多年在數(shù)據(jù)采集方面的科研成果及研究專利,提供可信、專業(yè)、海量的數(shù)據(jù)抓取及分析服務(wù)。我們的功能定位主要包括三方面的工作:1、Web數(shù)據(jù)抓取服務(wù);2、Web數(shù)據(jù)抓取工具開發(fā);3、定制Web Service服務(wù)。主要應(yīng)用在包括機(jī)票、酒店、圖書、評(píng)論等電子商務(wù)領(lǐng)域信息的采集及處理。)
背景介紹
目前,互聯(lián)網(wǎng)開放信息增長(zhǎng)迅速,蘊(yùn)含著大量有價(jià)值的數(shù)據(jù),成為人們獲取信息的主要途徑。但Web數(shù)據(jù)具有動(dòng)態(tài)性、異構(gòu)性及海量的特點(diǎn),致使用戶在Web數(shù)據(jù)獲取方面遇到很大的挑戰(zhàn)。)
應(yīng)用前景
該成果是網(wǎng)絡(luò)信息處理領(lǐng)域具有前瞻性的研究成果,目前提供該項(xiàng)技術(shù)服務(wù)的公司非常少,市場(chǎng)潛力大,在旅游等電子商務(wù)領(lǐng)域具有良好的應(yīng)用前景。)