注:公司对于媒体采访比较谨慎,早早要求发去提纲去证监局备案,
@大头78 兄帮我梳理了很多问题,董秘说年报未出,这些不便讲,要不就算了,几经周折还是成行,答应只问一些大方向的东西,财务指标都没有涉及,约了年报后再聊。
以下是董秘徐景明接受采访的原话全文,略作标注方便阅读。除了括号中的内容外,都是原话。兄弟我能力有限,大家轻拍。
一、关于语音识别技术
1、语音识别技术简介
我先给大家介绍一下什么是智能语音技术。用最通俗的话讲,就是让机器像人一样能挺会说的技术。比如语音合成技术,就是给机器装上嘴巴,它能把我们的文档、email、网上各种的网文,转化成标准的语音,朗读给我们听,就是让机器说话的技术;还有语音识别技术,就相当于给机器装上耳朵,它把我们说出的语音的信息,包括内容、说话人、语种等信息准确地识别出来。还有语音评测技术,就是你对系统说一段话,中文或者英文,它对你的发音标准进行打分,评价和反馈指导,可以指导你如何发音,如何去改善。还有自然语言理解、声纹压缩、编解码等等相关的技术。
2、语音识别技术是人机交互又一次革命
语音作为人类交流最自然最便捷的方式,语音交互技术是交互技术。我们看人机交互技术,最早是采用纸带打孔,拿个纸带输到计算机里;后来以DOS代表的命令行技术,键盘就出现了;在后来就是触摸、图像,就是苹果和微软推出的推行操作界面,包括现在的触屏,所有这些交互方式都是接触式的交互,就是必须人和机器接触才能交互。随着移动互联网时代的到来,人随时处在移动的状态,终端设备也越来越小,用传统的方式肯定越来越不方便。还有就是年纪稍微大点的,你让他用键盘也不太现实,所以语音技术的方便性就越加凸显了。我们走在路上,在各种场合里,通过语音的方式直接可以实现顺利便捷的交互,所以有广泛的应用。
3、语音识别技术的应用领域
从这个角度讲,语音技术的应用领域是无所不在的。比如说智能家电、汽车、教育、呼叫中心和手机,等等各个领域。
1)家电,以电视机为例,很多电视都智能了,可以上网了,但是坐在沙发上怎么操控,传统的(遥控器)123456上下左右,是无法做到,或者即便可以也太痛苦了,输一个汉字要很长时间。我们现在和电视机厂商合作,拿起遥控器按一个按钮,说出你要看的电视节目,要看《泰坦尼克号》,要看昨天的《新闻联播》,或者要看前天的某一场乒乓球赛,或者要查询天气,就直接可以把相关信息展现在电视机上,像这样的应用。大家可以展开想象,这是必然的趋势,我们和各大电视机厂商都在合作。
2)汽车,汽车也是典型的移动终端,在开车的时候我们视线必须集中在路况信息上,不能看影响安全的显示工具,以车载导航设备为代表,必然要涉及语音技术。以前的语音合成技术应用较多,提供路况信息,现在语音识别信息也应用进去了,你可以说出你要到什么地方去,或者调频道,调到什么台,或者打开空调调到多少度,只要一说,就能够实现。
3)还有比较多的就是呼叫中心。银行啊,运营商啊,电话打进去,传统的是先是一段广告,进去以后是按1进入什么,按2进入什么,一直按到789,说完以后进入下级菜单,又是按123,或者按0转到人工,又是漫长的等待,这种体验大家都有过。通过智能语音技术,就可以解决这样的问题,拿起电话直接说出想要的服务,跟他说我信用卡丢了,或者查询余额,或者运营商方面,我想查询上个月的流量是多少,可以通过语音的方式自然交互,这些都是重要的运用。
4)还有就是教育。举个直接的例子,我们国家有个普通话等级考试,以前全部采用人工评测,考生在下面,底下几个考官打分,无论从打分的公正性,大规模考试的组织,关键是它也只能给个结果,也不能进行反馈。所以大家迫切需要使用机器。我们在这方面取得了突破性的进展,现在全国全面使用机测。我们现在我们也在做英语的评测,现在江苏的中考,广东的高考,都在进行应用。
5)未来语音技术在各个领域,有着非常广阔的运用。当然大家了解讯飞,更直接的是通过手机上的应用,我们的讯飞输入法,已经成为主流的手机输入法之一,也是网上星级最高的输入法。另外还有讯飞语点,包括和移动合作的灵犀。
二、技术发展和产业环境的发展成熟,助力语音产业实现井喷
一个产业的发展,高技术产业的发展还是取决于两个因素,一个是这个技术是不是到了一个突破点、临界点,可以实现大规模应用;第二个产业环境是不是支持这种大规模爆发。
1、第一个是技术层面,智能语音方面,包括语音合成,语音识别和自然语音理解,其实我们可以看到,包括我们使用讯飞产品可以体验到,我们在语音合成方面是业界唯一超过普通人说话水平的语音合成技术,我们从06开始,参加美国和日本联合举办的“暴风雪”挑战赛,全球的英文合成比赛,一直到2012年,我们蝉联了七届该比赛第一名,所以语音合成超过了正常人说话水平,当然后续还要往多情感角度发展,但是使用已经完全没有问题了。大家用过讯飞输入法,在识别角度来看,常用语句已经达到了非常高的识别率。我们有一个专业的评测,在不同环境下,不同语料的识别效果,基本上都是在80%以上,常用语句达到90%多以上,完全达到使用的水平。再包括我们的自然语言理解,现在的自然语言理解完全可以实用了,当然跟人一样理解还有很大的差距,但已经达到实用的要求了。还有我们的评测技术,在全国的普通话测试里全面使用。所以从技术角度说,这几年的技术突破,已经达到完全实用的水平。
2、除了技术之外,我们看产业环境,以最典型的手机为例,1)智能机大规模的普及,一个智能手机比当年的286、386强太多了,所以一台智能手机已经有足够的运算速度和存储空间,足以去运行相关的应用。2)第二个是移动互联网的普及,以前我们说语音技术很好,但要放到手机上,因为语音技术是一个庞大的工程,如果要集成到手机上,在单的手机上实现还是很困难的。三年五年前我们就知道语音技术可以在手机上应用,但当时的条件不允许。3)网络的普及,可以使我们的云计算,包括云计算技术的不断成熟,就使得我们可以用综合性的手段,解决应用的问题。比如语音识别,我们就可以在手机上输入语音,通过压缩加密发送到后台的服务器,然后解密、运算,然后把结果迅速返回到手机上,这个过程在不到一秒的时间里,就把结果展现给你了,从用户角度完全体会不到。这个就是整个的产业环境对它的支持。4)也包括呼叫中心的应用,这个产业环境就是劳动力成本的不断提升,土地成本的不断提升,每一个员工对自己的生活有更好的追求,小姑娘你让她一天到晚地接电话,是很痛苦的事情。所以这是从社会到经济一个综合的影响,使得语音技术已经去通过对传统产业的提升和改造,甚至创造出一个新的领域,就完全具备了发展的环境。
大家都很关心语音产业什么时候爆发,是今年还是明年,还是要从不同角度分析。第一个从行业角度,无论是从电视车载手机呼叫中心教育,对语音技术的需求都是非常迫切的,所以我认为市场机会是摆在那里的,需要我们和合作伙伴共同研究,怎么去满足这些需求,这个市场是肯定有机会的。另外我们面向新业务,面向移动互联网这个领域,我们也非常看好移动互联网的发展前景,而且认为这是一个B2C必然的趋势。但在这个领域还是一个战略投入期,我们现在更多的考虑因素是如何提升我们的效果,提升服务的能力,满足用户体验的需求,扩大用户规模,同时与合作伙伴一起构建商业的体系,这个在移动互联网领域也不是讯飞一家,大家一方面看好,一方面也在思考这方面如何实现大的发展。
三、公司的移动互联网战略?
移动互联网现在公司不挣钱,现在是公司投入的阶段。看一个企业,关键看它的志向在什么地方,讯飞如果我们只想做一个盈利能力不错,过得比较舒服的企业的话,那我现在靠我的客户,我们一亩三分地,可以过得很舒服,很滋润。但是我们在创业初期,我们就提出我们将来要成为一个百亿规模的企业,销售收入达到一百亿的企业,这是我们未来的志向。这样你就必须从行业客户,从B2B往B2C去延展,让我们的产品进入到千家万户,进入到亿万家庭,为每一个客户提供服务,这是一个必然的趋势。这个战略方向是明确的,所以我们要知道,我们的投入,什么是战略性的投入,什么是策略性的投入。我们现在移动互联网领域,我们的移动互联事业部大概有上百人的投入,这只是一个事业部的投入,还不包括我们围绕移动互联网进行的各种相关资源的投入,各种综合性的投入还是很大的,但我们认为这是战略性的投入,是公司为了取得未来三年或更加长远的大发展必须进行的投入。同时,我们行业的发展,又可以保证我一方面保持健康的发展,另一方面可以支持目前的投入,这才是一个有志向的企业为股东、社会做出最大回报的长期战略考虑。
{相比于百度等大公司的核心竞争优势?}
语音产业是一个非常广阔的产业,这个产业足够大,尤其是手机领域,别想哪一家通吃市场,包括我们现在看到的siri、百度,好多公司都在推相关产品。所以在这个领域,大家首要需要解决的是如何解决用户体验的问题,现在的应用还都是初期的应用,离真正自然便捷还有一个过程,在这个过程中大家比的是综合能力,包括技术能力,产业整合能力,跟合作伙伴构建商业链的能力,是一个综合能力。现在来评价这些,还是太早。从讯飞角度来讲,我们是一个开放的心态,我们愿意跟行业内所有企业进行充分的沟通和合作。
四、资本层面和财务指标
{资本层面,中移动稀释了15%。管理层怎么考虑的?}
中移动跟讯飞是战略合作,它的入股实际上并不影响。第一,它如果后讯飞团队还是第一大股东,实际控制人还是创始团队;第二,讯飞在公开材料里也很明确,包括奚总、李跃总都讲得很清楚,它追求的是协同发展,不追求对讯飞的控制,它也不会派人参与讯飞管理。所以我觉得这是一种良性的协同发展的状态,不会……移动入股的先决条件是,讯飞团队必须牢牢把握住讯飞的控制地位,这是明确的。
{公司毛利率}
各块的数据不太一样,比如像支撑软件这块,纯软的,提供核心技术的,毛利率比较高,90%几,有一些芯片产品就比较低,因为有硬件了,在行业应用系统这块,在增值业务这块,就是70-80%,因为我要先进行硬件投入,都不太一样。……在中国我们也在思考,中国能不能出现一个微软,出现一个高通,完全靠纯软或纯核心技术来实现规模化发展的企业,其实可能挺难的,比如软件盗版的问题,对核心技术认知度的问题,所以你必须综合产业的上下游的发展。
五、讯飞的志向
志向肯定是有的,是微软,是百度还是腾讯倒不重要,我们希望成为未来中国信息产业的一个标杆企业。我们有自己的志向。其实在讯飞创业之处,很遗憾今天刘总不在,他们为什么创业,这帮人当时要是出国,刘庆峰当时是微软直接挖的对象,当时让他到微软去工作,当时他们为什么不出国,为什么不到外企里面去,当时创业时,科大的一帮学生,99年,正是互联网第一个热潮的时候,他们到其他公司,都是上万的月薪,他们在讯飞都是拿着一千块钱的工资,他们当时想的就是,中国的语音技术要由中国人做到最好,要掌握在中国人的手中。就是有这样一个志向,所以我们希望未来讯飞的发展,也是要对股东,对员工,对社会要有我们充分的回报,将来我们要代表国家参与全球化的IT竞争,这是我们的志向。我们在十年大会时,提出了一个我们的事业影响中国的未来,其实我们确实觉得是这样的。这个国家有各种各样的企业,各种各样的组织,每个组织都在做贡献。对于讯飞来说,我们创造独特的价值,这种价值通过我们的智能语音技术,通过人机交互技术,怎么去改善我们的生活方式,人跟机器的交互方式。所以我们很欣慰的是,大家使用讯飞的技术,通过它大家更快捷了,小孩子通过它来学,普通话和英语讲得更标准了,提纲他们的竞争力,我们打电话获取信息更方便了,不是123地去按了,这就是我们改变世界所做出的贡献。
{管理层有个30年不减持的承诺?}没有这个说法。
{注:最起初的创始团队共有十几个人,除了一人因身体原因,一人因移民离开之外,其余元老目前还都在公司供职,从1999年至今}
关于产业联盟
这个不是我分管,具体不是特别清楚。语音产业是很重要的产业,在信息安全、国家战略里面都有价值,也是在工信部的指导下,国家各个领域的,包括运营商、家电、汽车,各个领域的领军企业,19家企业,共同设立了中文语音产业联盟,这样一个单位,
科大讯飞 是里面唯一一个语音技术提供组织。这个联盟的作用,就是大家通过积聚的力量,共同推动语音技术的发展,共同将语音技术应用到各个领域。汽车有上汽、家电有长虹、手机有联想华为、包括三大运营商……
讯飞语点Appstore上线过程
我们在12年6月下旬首次提交了申请,然后就是漫长曲折的过程,7月份他说要补充材料,9月份时他说与siri太过相似,所以拒绝,我们也没办法,实际上那个时候我们也看的很清楚,包括业界的评价,就是明显比siri要好,讯飞语点是业界最好的语音助理,比siri好很多。我们也是不得已,就是希望让苹果的手机用户能享受到最好的智能语音应用,所以在年初时不得已进行了一个裁剪,很多的基础功能,打电话发短信都裁剪掉。这个事情我们也挺遗憾的,主要是不能让大家体验到最好的效果,当然我们后来也会和相关单位,和苹果保持沟通,希望能够让大家使用上更好的效果。用过的肯定知道,用语点打电话发短信非常方便。我们也希望苹果这样一个国际化的大公司,以更开放的心态,就是把业界最好的东西拿到它的平台上去,这只会对它的产品销售产生促进作用,这不仅对苹果,对产业也是一个促进作用。