$星环科技(sh688031)$ 星环公司专注于
大数据基础软件,已发布通用大模型‘乌鸦‘及知识平台架构,全面转向AIinfo,致力于降低数据应用门槛,增强金融等行业应用能力。介绍了一个基于TKS原地升级的
人工智能运营平台,该平台集成了大模型、语料库和数据存储平台,强调了端到端工具的重要性及通过提升模型训练迭代效率来优化大模型的效果。在市场上,一些国产数据库虽然基于开源数据库如PG或MySQL,但在管理上存在混乱,推动企业向自主研发转型。其中某公司通过改进内核和增加实时数据分析能力,在高并发场景下展现出优势,并计划与
惠普 等合作,推进AI技术应用,并保持对全年业绩的乐观预期。新环科技凭借其在人工智能领域的深厚积累,尤其是通用大模型和ARPC的应用,在金融领域展示了强大的实力,并强调以结果为导向,通过技术创新促进客户的数据化治理。公司将继续重点投资于基础软件的研发,加大对人工智能领域的大模型及分布式向量数据库的投入,并加强
数据要素 和量化投研领域的研究。此外,通过校园招聘吸引高学历人才,公司采用行业线和区域管理模式,金融和政府行业为主要收入来源,特别在银行领域面临国产化和性能升级需求,形成了较大市场机遇。重点介绍了如何通过采用统一的技术架构来构建一个高效的大数据平台,该架构由五大层组成,强调分布式工程能力和对多模型数据处理的集成能力是平台的核心竞争力,能够保证高扩展性和灵活性,同时降低客户成本并简化运维复杂度。
章节速览
●00:00新环公司推进AI技术,强化大数据基础软件
新环公司专注于大数据基础软件,已发布通用大模型‘乌鸦‘及知识平台架构,全面转向AIinfo,致力于降低数据应用门槛,增强金融等行业应用能力。
●06:34推动人工智能运营平台发展与应用
介绍了基于TKS原地升级的人工智能运营平台,该平台集成了大模型、语料库和数据存储平台,重点强调了端到端工具的重要性及如何通过提升模型训练迭代效率来优化大模型的效果。此外,还提到了如何利用此平台促进数据的更好使用,以反哺基础数据处理平台,实现数据驱动的增长模式。
●09:55探讨数据库自主研发与市场竞争力
市场上许多国产数据库基于开源数据库如PG或MySQL,但面临管理混乱等问题,推动企业向自主研发转型。其中,某公司通过改进内核和增加实时数据分析能力,在高并发场景下展现优势。同时,该公司还计划与惠普等合作,推进AI技术应用,并保持对全年业绩的乐观预期。
●14:53新环科技:深耕大数据与人工智能,推动数据库市场创新新环科技凭借其在人工智能领域的深厚积累,特别是通用大模型和ARPC的应用,致力于提供高效的数据分析和处理服务。作为一家理科背景的公司,新环科技在金融领域展示了强大的实力,特别是在对上市公司年报的深入解析上。此外,新环科技强调以结果为导向,通过实际效果驱动业务增长,旨在通过技术创新促进客户的数据化治理,提升大数据平台及各类数据库软件的销量。面对日益激烈的市场竞争,尤其是在国产数据库厂商众多的背景下,新环科技凭借其在分布式数据库领域的技术优势,如对分布式数据一致性的早期实现,以及能够在单一平台上支持多种数据类型的独特能力,确立了自己的市场地位并持续推动行业的创新发展。
●19:24公司加大基础软件及AI研发投入
公司将继续重点投资于基础软件的研发,并加大对人工智能领域的大模型及分布式向量数据库的投入。此外,将加强
数据要素和量化投研领域的研究。研发团队将进一步扩充,特别是通过校园招聘吸引高学历人才。
●22:54探讨销售策略及市场机遇
公司采用行业线和区域管理模式,金融和政府行业为主要收入来源。金融行业尤其在银行领域面临国产化和性能升级需求,形成较大市场机遇。
●26:05构建高效大数据平台的关键技术与架构
本次讨论重点介绍了如何通过采用统一的技术架构来构建一个高效的大数据平台。该架构由五大层组成:最上层为统一的数据操作查询语言,使得用户无需了解底层细节即可进行数据操作;第二层为统一的分布式计算引擎,能够支持批处理、流处理等多种计算模式并优化分析性能;第三层至第五层则分别介绍了支持不同类型数据的存储引擎、统一的分布式存储系统以及统一的资源管理框架,后者基于容器云技术,能实现对底层硬件资源的灵活调配。此外,还强调了分布式工程能力和对多模型数据处理的集成能力是该平台的核心竞争力,这使得平台能够在保证高扩展性和灵活性的同时,降低客户成本并简化运维复杂度。
问答回顾
发言人问:新环公司的整体情况及最新发展如何?
发言人答:新环是一家致力于大数据基础软件的企业,在原有ABC(人工智能、大数据、
云计算)三大业务基础上,于去年年底推出了通用大模型“乌鸦”,并获得了工信部
ARTC备案,标志着公司在积极拥抱人工智能技术。此外,在今年5月31日的技术峰会上,创始人孙元浩宣布了公司将从DataInfo转变为AIInfo,全面转型为企业提供人工智能基础设施。
发言人问:新环如何打造稳固的数据底座以支撑其AI应用?
发言人答:新环自主研发了一款名为Hypo的向量数据库,支持单机版和分布式部署,是国内市场上仅有的商业化向量数据库之一。此外,还包括图数据库、分析数据库和实时数据库等组成部分,共同构成强大而灵活的知识存储与服务体系,确保AI应用中的数据读写高效且及时。同时,新环还提供了自动化或半自动化的语料获取、整理和治理工具,以及图形化工具用于知识体系的构建,进一步提升了语料资源的质量和开发效率。
发言人问:新环知识平台的具体架构是什么样的?新环是如何利用大模型提升数据分析效率的?
发言人答:新环的知识平台由三个基本模块组成,即知识存储与服务、语料开发与知识构建以及大模型基础服务。在此基础上,还包含了乌鸦问这一已经公开测试的应用,以及即将推出的无涯问数等四大应用层面的产品,如乌鸦问,可以通过自然语言交互实现数据库查询、数据分析,并生成BI报告供业务人员查看。此外,新环还拥有丰富的专业知识库,包括财经资讯、法律法规和学术研究等内容,以支持多领域的应用需求。新环的大模型应用于业务场景时,能理解业务人员的自然语言需求,并将其转化为数据库操作指令,直接从数据库中提取所需数据进行分析处理后反馈给相关人员。这一系列流程通过无涯问数、无涯金融、无涯工程等多个应用得以实现,降低了数据分析师的工作门槛,缩短了新环与终端业务客户之间的距离。
发言人问:请问在当前的人工智能运营平台上,如何实现对现有客户和新客户的数字化治理?
发言人答:人工智能运营平台通过构建三大模块——工具、大模型及应用层,为客户提供一个完整的数字化治理方案。该平台旨在将原有的DataInfo转变为AirInfo,并在过去一年的产品和技术迭代中不断优化和完善。这一系列升级都是为了更好地服务于我们的核心产品TDH大数据平台和Apple/Drip等组件,通过提升数据处理能力、开发高质量工具及大模型应用,让客户能更高效地利用数据,从而间接促进平台本身的扩展和发展。
发言人问:在当前市场环境下,国产数据库厂商普遍采用开源内核(如PG或MySQL),对于企业而言,自主研发而非依赖开源的核心竞争力体现在哪些方面?
发言人答:虽然很多国产数据库厂商采用开源内核作为基础,但在实际应用过程中,他们发现了开源存在的诸多局限性,比如组件开发分散、管理混乱等问题。例如,华为的高斯BB基于PG内核但在实时数仓场景下存在短板,而我们的IOSSD凭借分布式架构和增量数据分析优势,能在高并发压力下保持稳定运行,尤其在疫情期间应对大规模核酸核查需求时展现出显著优势。此外,与许多基于MySQL改造的数据库相比,坤DB在高可靠性和分布式一致性上有更好的表现。因此,自主研发的关键在于根据市场需求定制适应性强、性能卓越且易于管理的产品,以此区别于竞争对手并获得市场份额。
发言人问:能否介绍一下公司与惠普、宏基、安硕等合作伙伴在人工智能领域的最新进展及其未来规划?
发言人答:我们已与惠普等合作伙伴推进AIPC项目,在四季度预计会提供搭载预安装大模型(如7B级别及以下)的新环产品,包括不同品牌的预装版本。尽管具体上线时间可能因生产排程有所不同,但合作伙伴之间的竞争处于我们的规划之中,我们致力于推动人工智能相关产品的广泛应用。
发言人问:公司上半年的业绩情况如何?是否存在调整年收入指引的情况?
发言人答:由于临近半年报披露时间,不便透露具体数据。但总体而言,公司全年订单和收入展望保持不变,未调整指引。
发言人问:公司在人工智能领域有哪些系统的布局及突出优势?
发言人答:公司在人工智能领域的系统主要包括通用大模型乌鸦和ARPC应用。乌鸦大模型尤其擅长金融领域的语料、案例分析以及法律法规解读等方面的工作,展现出了强大的数据驱动能力。此外,公司重视用户体验和实际效果,坚持以结果为导向,希望通过这两种应用驱动客户进行数据化治理的基础建设,无论原有是否有数据中台或底座,都能帮助提升大数据平台和各类数据库软件的销量。总之,公司的整体产品策略是从DataInfo转向AIInfo,强调数据存储、读取、计算的准确性与并发处理能力的重要
性。发言人问:目前市场上的数据库厂商竞争格局如何?未来的发展趋势将如何变化?
发言人答:在数据库市场中,存在不同细分赛道的竞争,例如新环公司专注于大数据平台和分布式数据库领域,而达梦则在单机版市场上有所布局。双方在特定领域的竞争并不直接碰撞,这意味着数据库软件仍有明确的细分市场需求。
发言人问:新环公司在大数据平台和技术上有哪些独特之处?
发言人答:新环公司不仅是国内唯一一家能在单一平台上支持11种数据类型的自研企业,而且提出了“国仓集一体”的解决方案,实现了只需存储一份数据即可同时应用于数据库、数据集和数据仓库等多种应用场景,并通过先进技术保障了数据一致性及高并发处理能力,这是公司的核心技术优势之一。
发言人问:新环公司在研发投入和人力资源规划上有何特点?新环公司的研发重点发展方向及投资规模如何安排?
发言人答:新环公司长期以来坚持高强度的研发投入,尤其是基础软件领域,且注重人员储备的增长,主要依靠每年的校招补充新鲜血液。今年预计将在研发部门新增数十名人员,且严格筛选标准,倾向于招收来自C9学校计算机专业背景的硕士生,以保证科研质量的提升。新环公司的研发投入主要集中在人工智能大模型和分布式向量数据库等前沿技术领域,而在数据要素以及量化投研等方面也将进行投入,但规模不会像前者那样巨大。预计今年在人工智能和分布式向量数据库方面的研发力度将持续加大。
发言人问:新环公司当前的销售组织架构及下半年销售策略是怎样的?
发言人答:新环公司的销售组织架构按照行业线管理和区域划分,设有金融、政府和其他行业三大业务线,其中金融线和政府线占据较大份额。下半年的销售策略将以现有优势行业为核心,结合市场实际情况灵活调整,尤其是金融行业(尤其是银行业)由于国产化需求增长、原有大数据平台面临替换等因素,预计将迎来更多的业务机会和订单增长。
发言人问:能否详细解释一下大数据平台所采用的统一技术架构及各层的主要功能?
发言人答:当然可以。我们的大数据平台采用了五层结构。第一层是统一的数据操作查询语言,类似于SQL用于操作各种数据库(如关系数据库、搜索引擎、空间地理库等)。第二层是统一的分布式计算引擎,能同时支持批处理、流处理、混合负载以及不同数据量下的高效分析性能。第三层是十一種存储引擎,各自专长于不同类型的数据处理。第四层是一个统一的分布式存储系统,负责管理所有模态数据的分布、复制和一致性控制。最底层则是基于容器云技术的统一资源管理框架,可以灵活调度和管理不同硬件资源(如X86和ARM),实现底层硬件资源的统一管理和调配。
发言人问:在大数据处理方面,该平台有哪些关键的核心能力和特点?
发言人答:在大数据处理方面,我们的平台拥有两个核心能力。首先,在分布式工程技术上处于行业领先地位,通过去年参加的一万节点的测试证明了其出色的横向分布式扩展性和对底层硬件资源的灵活调配能力。其次,我们的平台能够集成多种数据模型的处理能力于同一平台上,实现了真正的无仓储一体化解决方案,不仅减少了客户因使用不同产品而产生的成本,还简化了运维流程,极大地提升了客户的使用体验和效益。