文 | 王方玉J9九游会体育
裁剪 | 苏建勋
现在绝大多数生成式 AI 产物的底层工夫齐源于 2017 年谷歌冷漠的 Transformer 模子架构,而国内一家 AI 创业公司——彩云科技却自出机轴,建树出了全新的模子架构 DCFormer,并基于此推出新产物。
11 月 13 日,彩云科技在北京总部发布了首款基于 DCFormer 架构建树的通用大模子云锦天章。
据 CEO 袁行远先容,云锦天章不错收尾在臆造寰宇不雅的基础上,赋予演义东说念主物编程、数学等基础智商,不错高速针对大齐笔墨进行扩写、缩写,针对著作作风进行大容量更换,同期兼具其他模子的问答、数学、编程等基础智商。
除了擅长的诈欺场景不同,云锦天章与惯例大模子最大的各异还在于底层模子。据先容,通过校正防护力矩阵,在接头窥探数据下,DCFormer 架构最高不错将算力智能调度率普及至 Transformer 的 1.7 到 2 倍。
此外,DCFormer 是在 Transformer 的基础上进行校正,约略和现存的模子重叠,而不是互斥,因此统共基于 Transformer 架构的大模子齐能在 DCFormer 的基础上裁减本钱。
彩云科技对于 DCFormer 架构后果的有关论文已于本年 5 月在第 41 届海外机器学习大会 ICML 2024 认真发表,该会议是海外机器学习限度的三大顶会之一。此外,DC Former 的模子代码、权重和窥探数据集,曾经经在 Github 一起开源。
为何遴荐别具肺肠接受 DCFormer 架构?袁行远告诉 36 氪,AI 在开动历程中对动力的雄伟需求已成为行业共鸣,改善模子底层架构以提高服从是应付这一挑战的最恋战略。模子服从的普及,也不错有用地裁减东说念主工智能升级迭代的本钱,加快 AI 时期的到来。
固然 DC Former 架构不错压缩大模子窥探推理的本钱,但彩云科技在买卖化探索方面相对严慎,留情进入产出比。
现在彩云科技旗下有彩云天气、彩云小梦、彩云小译三款面向 C 端用户的 AI 产物,在大家市集取得了进步 1000 万好意思元的 ARR(年度常常性收入),是国内为数未几约略收尾盈利的东说念主工智能公司。其最近一轮融资是由快手前 CEO 宿华个东说念主投资的 B2 轮,投前估值达到 1.2 亿好意思元。
袁行远告诉 36 氪,彩云科技对 DCFormer 架构的权术及诈欺建树,主要管事于自己业务。现在,彩云小梦基于 V3.5 模子J9九游会体育,在保捏逻辑敞开与形色精细的前提下单次不错创作几百字到一千字的本体,将来有望冲破到 2-5 千字的创作,收尾更强的智能水和蔼更高的用户活跃度接洽。