
實(shí)現(xiàn)DeepSeek系統(tǒng)本地化 書(shū)寫(xiě)?yīng){子山下創(chuàng)科傳奇
在人工智能(AI)科技迅猛發(fā)展的浪潮中,香港憑藉優(yōu)秀的科研水平,加上背靠祖國(guó)的技術(shù)支撐,不單沒(méi)有缺席,更推進(jìn)了整合創(chuàng)新的提升。自今年1月以來(lái),內(nèi)地AI大模型DeepSeek的發(fā)展衝擊全球,由香港科技大學(xué)領(lǐng)軍,聯(lián)合四所本港及一所海外頂尖大學(xué)的人工智能科學(xué)家組成的InnoHK香港生成式人工智能研發(fā)中心(HKGAI)團(tuán)隊(duì),在本地生成式AI研發(fā)基礎(chǔ)上,昨日正式發(fā)布了全國(guó)首個(gè)基於DeepSeek全參數(shù)微調(diào)並持續(xù)訓(xùn)練產(chǎn)生的大模型HKGAI V1。該模型依託香港本地獨(dú)有數(shù)據(jù),實(shí)現(xiàn)了DeepSeek的本地化,以及面向國(guó)際的出海重塑,同時(shí)推進(jìn)AI的開(kāi)源與國(guó)產(chǎn)化適配。除了服務(wù)港人外,HKGAI V1未來(lái)更計(jì)劃擴(kuò)展服務(wù),為海外6,500萬(wàn)的華人社會(huì)提供大模型及相應(yīng)應(yīng)用。 ●香港文匯報(bào)記者 陸雅楠
特區(qū)政府創(chuàng)新科技及工業(yè)局局長(zhǎng)孫東在昨日發(fā)布會(huì)表示,HKGAI V1的推出是香港AI發(fā)展的重要里程碑。自DeepSeek推出震驚世界,HKGAI團(tuán)隊(duì)迅速將其完美的底座模型架構(gòu),與自身模型傑出的數(shù)據(jù)處理功能有機(jī)結(jié)合,充分體現(xiàn)了在香港「一國(guó)兩制」的價(jià)值觀,也成就了HKGAI V1強(qiáng)勢(shì)推出。他形容,自HKGAI在InnoHK平臺(tái)下成立,至今推出自己研發(fā)的大語(yǔ)言模型,香港的生成式AI發(fā)展「歷時(shí)一年半,從無(wú)到有,書(shū)寫(xiě)了獅子山下一個(gè)美好的創(chuàng)科傳奇」。
AI科技浪潮 香港沒(méi)有缺席
孫東強(qiáng)調(diào),AI正引領(lǐng)新一輪技術(shù)和產(chǎn)業(yè)變革,特區(qū)政府積極應(yīng)對(duì),先後建設(shè)了人工智能超算中心,推出30億元人工智能資助計(jì)劃等,目前僅在科學(xué)園和數(shù)碼港就匯聚了超過(guò)800間AI企業(yè),聚集眾多人才,認(rèn)為特區(qū)政府針對(duì)AI發(fā)展,方向明確,措施有力,且行動(dòng)堅(jiān)決。他強(qiáng)調(diào)「在這波以人工智能為代表的科技浪潮中,很高興香港沒(méi)有缺席」,又大讚HKGAI的青年科研人員:「你們是最棒的!」
就香港首個(gè)基礎(chǔ)大模型HKGAI V1,港科大首席副校長(zhǎng)、HKGAI主任郭毅可介紹,這是業(yè)界首個(gè)基於DeepSeek671B全參數(shù)微調(diào),並持續(xù)訓(xùn)練的大模型,團(tuán)隊(duì)以一個(gè)月時(shí)間完成DeepSeek的香港本地化,而HKGAI V1自研的RAG系統(tǒng),也實(shí)現(xiàn)了從「問(wèn)題理解到知識(shí)檢索,以至內(nèi)容生成」的全流程智能處理,並提升了模型能力精度。
相信不久開(kāi)源 讓市民使用
在數(shù)字政策辦公室協(xié)調(diào)下,特區(qū)政府已有大約70 個(gè)部門(mén)參與試用HKGAI 提供的大模型輔助辦公應(yīng)用系統(tǒng),處理公務(wù)員文書(shū)工作,預(yù)計(jì)活躍用戶將突破數(shù)萬(wàn)。同時(shí),HKGAI V1亦於多個(gè)行業(yè)建立戰(zhàn)略合作夥伴,推動(dòng)產(chǎn)業(yè)智能化升級(jí)。
郭毅可透露,有信心不久後可讓HKGAI V1大模型正式開(kāi)源,讓香港市民和開(kāi)發(fā)者能夠直接使用,而開(kāi)源計(jì)劃也將進(jìn)一步激發(fā)本港的創(chuàng)新活力,促進(jìn)產(chǎn)業(yè)界、學(xué)術(shù)界和研究機(jī)構(gòu)的深度合作,推動(dòng)香港AI產(chǎn)業(yè)發(fā)展。
HKGAI V1 服務(wù)將包含免費(fèi)和收費(fèi)兩部分,郭毅可表示,團(tuán)隊(duì)會(huì)與特區(qū)政府商議,確保大部分功能免費(fèi)向公眾開(kāi)放,同時(shí)制定逐步開(kāi)放的時(shí)間表,以保障使用公平性。同時(shí)期望HKGAI V1 的應(yīng)用,可讓香港在全球AI領(lǐng)域彰顯東方之珠的獨(dú)特風(fēng)采。
香港本地生成式AI發(fā)展歷程
2023年 ChatGPT橫空面世,但面對(duì)不對(duì)香港地區(qū)開(kāi)放的問(wèn)題。特區(qū)政府迅速籌組、建立香港本土的研發(fā)平臺(tái),聚集多所本港及境外頂尖大學(xué)的力量,在10月成立了InnoHK香港生成式人工智能研發(fā)中心(HKGAI)
2024年上半年 HKGAI 開(kāi)發(fā)出第一個(gè)大語(yǔ)言模型的版本「港文通」(生成式人工智能文書(shū)輔助應(yīng)用程式)
2024年中 「港文通」率先在創(chuàng)科局開(kāi)始試用及訓(xùn)練,其後擴(kuò)至特區(qū)政府其他部門(mén),現(xiàn)時(shí)已有大約70個(gè)部門(mén)參與試用系統(tǒng)
2025年1月 DeepSeek R1推出數(shù)日後,團(tuán)隊(duì)在1月25日已經(jīng)決定使用其開(kāi)源數(shù)據(jù),重新訓(xùn)練本土人工智能大模型
2025年2月24日 HKGAI 團(tuán)隊(duì)花費(fèi)約一個(gè)月時(shí)間,成功推出全國(guó)首個(gè) DeepSeek全參數(shù)微調(diào)大模型HKGAI V1
●整理:香港文匯報(bào)記者 陸雅楠
評(píng)論