商湯(00020)發布升級的人工智能(AI)大模型,股價今早(24日)炒高,曾高見0.83港元,飆36%,最新升29.5%,報0.79元,成交額逾10億元。

商湯科技昨日發布「雲、端、邊」全棧大模型產品矩陣,以滿足不同規模場景的應用需求,同時發佈升級的「日日新SenseNova 5.0」大模型體系,聲稱其綜合能力全面對標GPT-4,加速生成式AI向產業落地的全面躍遷,實現大模型按需所取。

該企指,在人工智能發展最基本法則的尺度定律(Scaling Law)的準則下,將持續尋求最有數據配比並建立數據質量評價體系,推動自身大模型研發的同時,也為行業夥伴提供大模型訓練、微調、部署各類生成式AI的能力及服務。

據悉,「日日新SenseNova5.0」基於超過10TB tokens訓練,覆蓋大量合成數據,並採用混合專家架構,推理時上下文窗口可以有效到達200K左右。本次更新主要增強了知識、數學、推理及代碼能力。