醫(yī)療健康信息技術裝備制造汽車及零部件文體教育現(xiàn)代服務業(yè)金融保險旅游酒店綠色環(huán)保能源電力化工新材料房地產建筑建材交通運輸社消零售輕工業(yè)家電數(shù)碼產品現(xiàn)代農業(yè)投資環(huán)境
1、項目基本情況
本項目依托公司在大數(shù)據(jù)及人工智能領域方面的積累,通過引進先進軟硬件設備、擴充研發(fā)團隊、增加研發(fā)投入,開展知識工程的研發(fā)和產業(yè)化應用,解決項目建設生命周期中的知識引接、知識建模、知識抽取、知識清洗、知識融合、知識構建等問題,同時滿足基于知識工程的智能應用需求,最終形成閉環(huán)式的一站式、端到端知識平臺,解決底層數(shù)據(jù)處理能力不足、業(yè)務模式單一等問題。項目實施有利于充分發(fā)揮公司現(xiàn)有的技術優(yōu)勢及產品優(yōu)勢,鞏固公司在行業(yè)內的市場地位和擴大市場占有率,提高公司的盈利能力,為公司長期可持續(xù)發(fā)展打下堅實基礎。
2、項目實施的必要性
(1)有利于順應行業(yè)發(fā)展趨勢,積極進行戰(zhàn)略布局
隨著大數(shù)據(jù)及 AI 領域的蓬勃發(fā)展,國內外各大廠商在知識工程底層技術、理論研究上取得了一定的成果,包括非結構化多模態(tài)數(shù)據(jù)組織與理解、大規(guī)模動態(tài)圖譜學習、神經符號結合的知識更新與推理、基于大規(guī)模知識下游任務的預訓練模型等方面。
公司在大數(shù)據(jù)及 AI 產業(yè)快速發(fā)展的背景下,面臨著新一代知識工程在基礎理論、體系架構、關鍵技術等方面的挑戰(zhàn),為了能在激烈的市場競爭中實現(xiàn)可持續(xù)發(fā)展,公司必須順應行業(yè)發(fā)展趨勢,提高研發(fā)能力,積極建設上層應用系統(tǒng),實現(xiàn)戰(zhàn)略布局。
公司在政策指引、技術研發(fā)、產業(yè)化推廣等多方面因素的共同驅動下,依托行業(yè)知識與經驗,利用豐富的技術積累和數(shù)據(jù)支持,逐漸實現(xiàn)在金融、醫(yī)療、能源、制造等眾多領域的知識工程深度融合。
同時公司將在各行業(yè)的數(shù)字化轉型過程中,依靠大語言模型智能分析,建設跨領域、跨產業(yè)的 AI 知識助理,同步構建多模態(tài)知識工程以拓展應用場景和領域,使知識工程在更大范圍內與實體關聯(lián),最終形成完整的以“場景需求”為導向的知識工程解決方案,順應多模態(tài)知識產業(yè)的發(fā)展趨勢,進一步實現(xiàn)戰(zhàn)略布局的目標。
(2)有利于豐富產品應用場景,滿足下游市場的需求
近年來,隨著知識工程產業(yè)快速發(fā)展,其關鍵技術和理論方面取得了一定進步,以知識工程為載體的典型應用也逐漸走進各個行業(yè)領域,對公司知識助理項目的應用性能和應用場景提出更高要求。
目前,很多行業(yè)受到信息化和數(shù)字化的影響,在發(fā)展過程中遇到知識阻礙,同時又對數(shù)據(jù)挖掘需求較大,基于以上情況,公司計劃在當前的產品矩陣基礎上,結合新的深度圖算法技術,建設新一代支持多種推薦模式的知識推薦引擎。具體而言,公司將研發(fā)多種推薦類圖算法組合方式,以應對各種復雜業(yè)務知識推薦場景,并確保在各種知識推薦業(yè)務場景下,各維度性能參數(shù)都達到行業(yè)先進水平,同時結合知識業(yè)務引擎、文檔解析引擎、智能問答引擎和知識推薦引擎,滿足更復雜的業(yè)務場景需求。
在知識獲取和生成方面將進一步整合大語言模型的 NLU 能力和 AIGC 技術,打造一個統(tǒng)一、智能、高效的知識助理系統(tǒng)。該建設項目專注服務于政府、醫(yī)療、金融、教育、媒體等行業(yè)的細分客戶群體,相較于基礎數(shù)據(jù)的標準化平臺,該項目可以提供更加針對性的定制化的產品。
例如在政府方面,此項目產品可以將分散在政府各個部門、生產生活各個領域的相互孤立的數(shù)據(jù)資源聯(lián)通共享,實現(xiàn)多源數(shù)據(jù)集成交換,從而對政務數(shù)據(jù)和社會數(shù)據(jù)進行深度挖掘。在醫(yī)療領域,此項目可以聚合核心醫(yī)學概念和全方位的醫(yī)療生態(tài)圈知識,從海量的臨床案例中對經驗和知識進行提煉整理、錄入標注、體系構建,在解決優(yōu)質醫(yī)療資源供給不足和醫(yī)療服務需求持續(xù)增加的矛盾中產生重要的作用。知識助理項目建設將致力于開發(fā)高效、靈活、可擴展和易于使用的知識推薦引擎,以滿足不同用戶和企業(yè)的需求。
(3)有利于提升公司產品運行效率,增強產品核心競爭力
公司目前已形成大數(shù)據(jù)與云基礎平臺、分布式關系型數(shù)據(jù)庫、數(shù)據(jù)開發(fā)與智能分析工具的軟件產品矩陣,可以支撐客戶及合作伙伴開發(fā)數(shù)據(jù)應用系統(tǒng)和業(yè)務應用系統(tǒng),助力客戶實現(xiàn)數(shù)字化轉型。但公司現(xiàn)有產品是以底層數(shù)據(jù)庫邏輯建立而成,采取獨立數(shù)據(jù)模塊,獨立運行并輸出,無法提供一站式數(shù)據(jù)服務。為滿足客戶一體化需求,豐富產品系統(tǒng)設計,集成行業(yè)知識工程數(shù)據(jù),保障行業(yè)數(shù)據(jù)質量,公司將利用已有數(shù)據(jù)積累,融合分布式、SQL 編譯、多模型數(shù)據(jù)處理技術建設知識助理項目。
本次項目擬投入業(yè)內先進軟硬件設備,引進業(yè)界精英人才,重點開展知識工程的研發(fā)和產業(yè)化應用,解決知識工程建設生命周期中的知識引接、建模、抽取、清洗、融合、以及智能應用需求,形成以上游數(shù)據(jù)處理、中游知識建模、下游智能應用服務為閉環(huán)的一站式、端到端知識工程構建平臺。
它將提供智能應用業(yè)務組件,降低知識工程在行業(yè)領域落地的技術成本、時間成本、人力成本,提升產品的運行效率,為基于知識工程的智能應用建設提供支撐及賦能。同時此項目會開辟星環(huán)在行業(yè)知識工程建設的 PaaS 產品線,進一步提升產品的核心競爭能力,以促進公司持續(xù)、穩(wěn)定的長期發(fā)展。
3、項目實施的可行性
(1)相關產業(yè)政策為項目順利實施提供政策保障
近年來,國家高度重視人工智能產業(yè),頒布了多項規(guī)范并支持行業(yè)發(fā)展的相 關政策,以鼓勵人工智能產業(yè)不斷創(chuàng)新,驅動行業(yè)快速發(fā)展。知識工程作為人工 智能的組成部分,其技術在相關政策支持下也在不斷更新迭代。
2022 年 7 月,國務院科技部、工信部等聯(lián)合印發(fā)《關于加快場景創(chuàng)新以人工智能高水平應用促進經濟高質量發(fā)展的指導意見》,鼓勵行業(yè)領軍企業(yè)面向國 家重大戰(zhàn)略需求和國計民生關鍵問題,圍繞企業(yè)智能管理、關鍵技術研發(fā)、新產 品培育等開發(fā)人工智能技術應用場景機會,開展場景聯(lián)合創(chuàng)新。
2022 年 8 月, 國務院頒布《關于支持建設新一代人工智能示范應用場景的通知》,提出要重點 突破跨媒體統(tǒng)一表征、關聯(lián)理解與知識挖掘、知識圖譜構建與學習、知識演化與 推理、智能描述與生成等技術,實現(xiàn)跨媒體知識表征、分析、挖掘、推理、演化 和利用,構建分析推理引擎。
(2)下游豐富的應用場景為項目順利實施提供了廣闊的市場空間
認知智能是機器智能化的關鍵,而知識工程系列技術則是認知智能的核心。知識工程可以顯著加強機器的學習能力,推動人工智能的發(fā)展。目前知識工程較為常見的應用場景有金融行業(yè)的智能客服與智能檢索、政務領域的咨詢問答與分析預警、醫(yī)療行業(yè)的院內外醫(yī)療咨詢、警務領域的偵查等。
從更長遠的角度來看,知識工程還可進一步推動相關行業(yè)的數(shù)字化轉型和智能化水平,為未來更多的應用場景落地提供基礎能力支撐。下游豐富的運用場景為項目的順利實施提供了較為廣闊的市場空間。
公司在知識工程主要的應用行業(yè)金融、政府領域具備廣泛的客戶基礎。在金融領域公司已經取得一定市場份額,國內多家銀行、券商、基金等金融機構已采購公司產品及服務,且助力多個客戶實現(xiàn)了分析場景中部分關鍵系統(tǒng)的國產替代。
在政府領域,公司產品已被多個部委或省市機關部門使用,助力構建數(shù)字化政府,提升治理效率。目前公司的知識工程產品也已在部分行業(yè)實現(xiàn)了運用,積累了一定的客戶量?;谏鲜隹蛻艋A,未來公司的知識工程產品可實現(xiàn)較為快速的推廣。
(3)豐富的技術積累和充足的人才儲備為項目順利實施提供保障
在技術積累方面,公司已研發(fā)出 Inceptor、Slipstream、StellarDB、Scope 等一系列核心子產品,構建了 TDH 的多模型技術架構;同時擁有 Sophon 的 AI 能力聚焦于機器學習模型全生命周期中的模型訓練、模型管理、模型發(fā)布,搭建了多源異構算法框架,為打通數(shù)據(jù)之間的壁壘,提供統(tǒng)一的查詢引擎,實現(xiàn)各類復雜的跨模型查詢的知識助理項目建設,提供了充足的底層存儲和算法能力支撐。
在人才方面,公司通過外部引進及內部培訓,已經建立了一支專業(yè)知識扎實、研發(fā)經驗豐富、綜合能力優(yōu)秀的研發(fā)團隊,專業(yè)背景涉及大數(shù)據(jù)分析、人工智能等眾多領域。其中,核心管理人員均在國內外知名上市公司擁有數(shù)年的研發(fā)管理經驗,在政府、金融、機場等方面積累了豐富的行業(yè)知識,從而確保業(yè)務正確的發(fā)展方向,把握住市場機遇。
主要研發(fā)人員在 AI 技術自然語言處理、知識圖譜及圖算法挖掘、大數(shù)據(jù)技術及數(shù)據(jù)挖掘等方面擁有豐富的技術積累,先后取得《一種地址信息提取方法及裝置》《短文本多標簽分類》《一種分類模型的損失函數(shù)優(yōu)化方法及裝置》等多項專利。
4、項目投資概況
本項目投資金額共計19,113.55萬元,主要建設內容包括知識助理TKS的研發(fā)、 統(tǒng)一圖計算引擎TKS UGE的研發(fā)、文檔解析引擎TKS DDE的研發(fā)、知識業(yè)務引 擎TKS KBE的研發(fā)、結合大語言模型的智能問答引擎TKS KBQA的研發(fā)、基于 深度圖算法的知識推薦引擎TKS KRE的研發(fā)。
5、實施主體和項目選址
本項目實施主體為星環(huán)信息科技(上海)股份有限公司,項目實施地點位于上海市。項目將先行在公司租賃的辦公場地實施,待本次募集資金投資建設的研發(fā)及運營中心投入使用后搬遷至該地實施。
6、項目實施進度
本項目計劃建設期為 60 個月。
7、項目涉及報批事項
截止本報告發(fā)布日,本項目備案手續(xù)正在準備過程中。本項目不同于常規(guī)生產性項目,不存在廢氣、廢水、廢渣等工業(yè)污染物。不屬于根據(jù)《中華人民共和國環(huán)境影響評價法》和《建設項目環(huán)境影響評價分類管理名錄》等相關法律法規(guī)需要進行環(huán)境影響評價的建設項目,因此,本項目無需進行項目環(huán)境影響評價,亦不需要取得環(huán)保主管部門對項目的審批文件。