据《麻省理工科技评论》报道,除DeepSeek之外,值得关注的四家中国
人工智能初创公司如下:
阶跃星辰(Stepfun)
- 成立时间与背景:2023年4月由前
微软 高级副总裁姜大昕创立。
- 技术特点与成果:2024年发布了11款基础AI模型,涵盖语言、视觉、视频、音频以及多模态系统等多个领域。大型语言模型Step-2参数超1万亿,在LiveBench上仅次于ChatGPT、DeepSeek、Claude和Gemini的模型。
面壁智能(ModelBest)
- 成立时间与背景:2022年由清华大学知名研究团队在北京海淀区创立。
- 技术特点与成果:专注于效率提升,顺应端侧模型发展趋势,推出MiniCPM系列模型。MiniCPM 3.0仅有40亿参数,但在各种基准测试中的表现与GPT-3.5相当。
智谱AI(Zhipu)
- 成立时间与背景:源于清华大学团队,与政府和学术界关系密切。
- 技术特点与成果:既专注于基础模型研发,也基于模型开发了对话模型ChatGLM等一系列AI产品。其最先进的大型语言模型GLM-4-Plus,性能与GPT-4相当。还开发了GLM-4V-Plus,是一种能够解释网页和视频的视觉模型。
无问芯穹(Infinigence AI)
- 成立时间与背景:成立于2023年,入驻徐汇区模速空间,清华系企业。
- 技术特点与成果:专注于AI基础设施领域,核心竞争力在于通过“多元异构、软硬协同”的核心技术,打造连接“M种模型”和“N种芯片”的“MxN”AI基础设施新范式,实现多种大模型算法在多元芯片上的高效协同部署。推出的Infini-AI异构云平台可向大模型开发者提供高性能算力和原生工具链,大规模模型的异构分布式混合训练系统H
ETHUB可将AI模型训练时长压缩30%。
亿田智能 的子公司浙江亿算在去年11月与无问芯穹签署了算力服务协议,而无问芯穹云平台已经上架DeepSeek的多款大模型。目前亿田智能间接通过无问芯穹云平台为软件客户调用DeepSeek大模型提供算力支持。